欢迎访问LCE的博客,为你分享产品、技术、设计方面的作品实践和心得。

2020年06月的内容

PHP

phpquery or domdocument can’t parse html with special character like ‘<' not escaped

phpquery or domdocument can’t parse html with special character like ‘<' not escaped
最近在写一个 web 数据通用采集器。简单讲,就是对某个目标网站编写特定的规则,然后采集器可以根据这个规则去目标网站采集相应的数据。 比如我有条规则就是针对http://xiaohua.zol.com.cn/这个网站的。 然而在遇到一个特定的页面时,采集器报错。这个页面的地址是:http://xiaohua.zol.com.cn/lengxiaohua/34……继续阅读 »

lce 2周前 (06-29) 28浏览 0评论 0个赞