织梦采集https链接时获取到的网址错误解决办法

栏目:DedeCMS 来源:网络 关注:0 时间:2019-07-23

dedecms:采集https链接时获取到的网址错误解决办法

    接上一篇dedecms:采集https链接时却生成http协议请求的解决办法
织梦CMS采集https链接时出错,dedecms采集https链接时获取到的网址错误,如采集来源网址:https://www.hai1678.com/guochandianshiju/,我们想要获取来源网址里的https://www.hai1678.com/guochandianshiju/115969.html,当设置好匹配规则后,测试发现获取的影片网址却是https://www.hai1678.com/guochandianshiju/https://www.hai1678.com/guochandianshiju/115969.html。
解决办法:
将include/dedehtml2.class.php里面的408行
$okurl = $this->BaseUrlPath.'/'.$surl;
修改为
$okurl = preg_replace('/^https:///i', '', $surl)

注意:修改后会导致采集目标站内容页里的分页链接错误,(如:<li>1</li><li><a href="1_2.html">2</a></li>)的分页内容采不了。

本文标题:织梦采集https链接时获取到的网址错误解决办法
本文地址:http://www.q0738.com/dedecms/1178.html