欢迎来到欣怡建站!我们致力于提供优质的网站建站服务
注册

织梦自带采集无法采集端口不为80的网址错误解决方法

相关案例演示

织梦采集,一般用不到采集网址有端口的情况,少数有端口的网址就无法采集了。总结了下dede无法采集端口不为80的网址错误解决:

  问题描述,当采集的网址后代端口时(为防止有推广嫌疑就把网址换成xxx了。):

  测试采集网址::89/index.php/main/news/index.html?channel_id=104&page=1

  获取的列表测试信息网址是不带端口的结果是不带端口的数组集合:

  测试的列表网址: :89/index.php/main/news/index.html?channel_id=104&page=1

Array   (   [0] => Array   (   [title] => 讲座回放|施奠东—西湖,世界风景园林的   [link] =>   [image] =>   )   [1] => Array   (   [title] => 喜报|恭贺我院2019年度西湖杯荣获佳绩!   [link] =>   [image] =>   )   [2] => Array   (   [title] => 讲座预告|西湖——世界风景园林的杰出范   [link] =>   [image] =>   )   [3] => Array   (   [title] => 讲座回放|胡理琛—西湖七十年流变忆胜   [link] =>   [image] =>   )   [4] => Array   (   [title] => 讲座回放|彭嘉恒—“南师、禅及其在西方   [link] =>   [image] =>   )   [5] => Array   (   [title] => 讲座预告|胡理琛—西湖七十年流变忆胜   [link] =>   [image] =>   )   )  

  这样显然得到的网址是错误的。根本无法访问,也就无法采集了。

  经过一番查找,原来是dede 设置HTML的内容和来源网址 的函数问题,漏写端口判断了。

  在include/dedehtml2.class.php

  function SetSource 函数里大概79行加上红框里的内容:

image.png

  再测试一下。ok 了,这样网址就可以正常打开,采集到了。

  付上代码:

function SetSource(&$html, $url = '', $linktype='')   {   $this->__construct();   $this->CAtt = new DedeAttribute2();   $url = trim($url);   $this->SourceHtml = $html;   $this->BaseUrl = $url;   //判断文档相对于当前的路径   $urls = @parse_url($url);   $port=$urls['port']=='80'?'':':'.$urls['port'];//lyy 为80时候可以省略,否则就加上   $this->HomeUrl = $urls['host'].$port;   $this->BaseUrlPath = $this->HomeUrl.$urls['path'];   $this->BaseUrlPath = preg_replace("/\/([^\/]*)\.(.*)$/","/",$this->BaseUrlPath);   $this->BaseUrlPath = preg_replace("/\/$/",'',$this->BaseUrlPath);   if($linktype!='')   {   $this->GetLinkType = $linktype;   }   if($html != '')   {   $this->Analyser();   }   }  

作者:欣怡建站 挑错 时间:2020-02-09 11:09
首先声明,只要是我们的vip会员所有源码均可以免费下载,不做任何限制
☉本站的源码不会像其它下载站一样植入大量的广告。为了更好的用户体验以后坚持不打水印
☉本站只提供精品源码,源码在于可用,不在多!!希望在这里找到你合适的。
☉本站提供的整站程序,均带数据及演示地址。可以在任一源码详情页查看演示地址
☉本站所有资源(包括源码、模板、素材、特效等)仅供学习与参考,请勿用于商业用途。
☉如有其他问题,请加网站客服QQ(984818011)进行交流。
相关教程
在线客服