2013年9月5日 知道怎么把博客的文章采集到网站了

201395日 知道怎么把博客的文章采集到网站了

201395日 22:00

每天做同样的事,感觉也有点比耐烦啊。现在很纠结,博客不知道要不要换程序。感觉越不太习惯了,前天网上换的哪款主题,编辑器也有点问题。

在本地再次尝试了下用织梦程序采集博客的文章,前段时间有试过,不过没有成功。今天再次找教程试了下,教程都是按照列表页采集的。我以为是按照文章网址来的。是采集文章列表,然后在文章列表里面把相关网址提取出来。再去集文章。我的直接填写了五个固定的网址。按照教程一步一步的走下去,保存测试了下。有采集到,就准备把那五个网址的文章采集下来看看。结果保存去采集的时候,一直都内有反应。以为是我的规则填写错误了,反复检查了几篇,觉得也没有什么错。就网址是固定的,难道固定的网址不能采集吗?

又按照教程上的网址去采集了下,按照教程的网址,成是成功了,列表页有十几篇文章把,就采集了几篇。具体原因不知道。至少整明白了它是怎么弄的。

又重新把博客文章采集下,这次采集列表的,随便找了个类目。一个列表也有几十篇文章,看看能不能一下采集过来。重新建了一个规则。那个文章页的规则可以用刚刚准备固定采集的那个。只改下列表页就好了。设置好相应的规则,测试下,有采集到第一页的网址。保存好看看能不能采集成功。点击采集的时候,这个倒是有在动,速度不是很快。上了趟厕所采集完了。导出到本地网站的列表上,更新出来。还不错,不能和博客上的比。采集过来有点乱。图片也保存到了本地。要是保存的是远程图片就更好了。图片太占空间了。发现采集过来的文章,每篇采集了两次。两篇文章是一模一样的。起初还没整明白是怎么回事呢!后来发现是博客里的文章,头部都有那篇文章的链接,这样一采,就采集了两个网址,文章也就一样了。博客程序换不换再说了,说不定什么时候心血来潮就换了,呵呵。

下午玩了会游戏,植物僵尸,呵呵。

胡金玉 201395日 22:30

关于胡金玉

http://www.hujinyu.com http://www.hujinyu.com
此条目发表在个人日志分类目录,贴了标签。将固定链接加入收藏夹。

发表回复