全球主机交流论坛

标题: 谁有好的英文采集程序,介绍个! [打印本页]

作者: wfqvip    时间: 2010-11-2 12:57
标题: 谁有好的英文采集程序,介绍个!
最近想整个英文采集站,还没找到理想的程序,有没有好的介绍个
dede的没有e文版本,还有就是采集ezinearticles时出现内容空白,不知道是网站问题还是程序问题
作者: hdwz    时间: 2010-11-2 13:05
提示: 作者被禁止或删除 内容自动屏蔽
作者: Globalization    时间: 2010-11-2 13:05
离线下载器
作者: 低调    时间: 2010-11-2 13:14
诶...这是个好想法呢,采集ezinearticles
作者: 挨个搞    时间: 2010-11-2 13:21
自己写的脚本才是最好的

我在采集 ezinearticles
一天能采50w篇
作者: allforbbs    时间: 2010-11-2 13:21
直接采集 已采集好的站
作者: usa    时间: 2010-11-2 13:42
英文站采集没什么前途,搞不好因为版权问题被**了。。。
作者: 金满堂    时间: 2010-11-2 13:45
原帖由 挨个搞 于 2010-11-2 13:21 发表
自己写的脚本才是最好的

我在采集 ezinearticles
一天能采50w篇


你是怎么采的,我开火车这个站采100条封一次IP。
作者: 挨个搞    时间: 2010-11-2 13:45
搞采集拼的就是一个量

尽量采集没有版权的文章,如ezinearticles
最好能tbs改写下,能过copycape最好

另外要注意过滤成人内容,不然AdSense会被k
作者: wzwen    时间: 2010-11-2 13:46
采集不是问题,关键是站放在哪里比较安全
作者: 挨个搞    时间: 2010-11-2 13:47
原帖由 金满堂 于 2010-11-2 13:45 发表


你是怎么采的,我开火车这个站采100条封一次IP。


用代理啊,封了过半小时就解封了
我有500多个代理,轮换着采
作者: ehane    时间: 2010-11-2 13:49
又是个勤劳的站长
作者: 金满堂    时间: 2010-11-2 13:54
原帖由 挨个搞 于 2010-11-2 13:47 发表


用代理啊,封了过半小时就解封了
我有500多个代理,轮换着采


太牛B了,我真想结识你。
作者: hepac    时间: 2010-11-2 13:57
你们的站都在哪里啊,可不可以直接整站复制啊
作者: wfqvip    时间: 2010-11-2 13:59
原帖由 挨个搞 于 2010-11-2 13:21 发表
自己写的脚本才是最好的

我在采集 ezinearticles
一天能采50w篇

兄弟,你太牛了
作者: 我行我素    时间: 2010-11-2 14:15
原帖由 hepac 于 2010-11-2 13:57 发表
你们的站都在哪里啊,可不可以直接整站复制啊

这样省事
作者: 挨个搞    时间: 2010-11-2 14:16
原帖由 我行我素 于 2010-11-2 14:15 发表

这样省事


最好只换成你的域名,其他的包括内容,连接啥的都不变
作者: 挨个搞    时间: 2010-11-2 14:24
(, 下载次数: 6)
才了800多w篇了,大概还有2成就采完了

谁要我卖数据,1000篇以下一篇5分,超过一篇3分

标题,关键词,描述,类别全都有
正文html标签全在
另外还有相关内容文章的标题,可以当做评论
ini,mysql数据库打包都可以
作者: 狒狒    时间: 2010-11-2 14:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: 狒狒    时间: 2010-11-2 14:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: 我行我素    时间: 2010-11-2 14:31
原帖由 挨个搞 于 2010-11-2 14:24 发表
8730
才了800多w篇了,大概还有2成就采完了

谁要我卖数据,1000篇以下一篇5分,超过一篇3分

标题,关键词,描述,类别全都有
正文html标签全在
另外还有相关内容文章的标题,可以当做评论
ini,mysql数据库打包都可以 ...

一百万篇能卖3万了
作者: 挨个搞    时间: 2010-11-2 14:34
原帖由 狒狒 于 2010-11-2 14:25 发表

求推荐个中文成人词库,一时还不好找


中文的嘛,论坛上国内idc,只要在国内有服务器的,基本都有一个敏感词名单吧,可以找他们要

英文免费文章站一般自己已经过滤了,只要有成人内容的,就不显示google广告,只显示文章内容
这样的做个判断不采集就可以了
google的标准太模糊,靠关键词不准确的。。
作者: qwe321    时间: 2010-11-2 14:35
原帖由 挨个搞 于 2010-11-2 14:24 发表
8730
才了800多w篇了,大概还有2成就采完了

谁要我卖数据,1000篇以下一篇5分,超过一篇3分

标题,关键词,描述,类别全都有
正文html标签全在
另外还有相关内容文章的标题,可以当做评论
ini,mysql数据库打包都可以 ...

你也太会做生意了吧
作者: 挨个搞    时间: 2010-11-2 14:37
原帖由 我行我素 于 2010-11-2 14:31 发表

一百万篇能卖3万了


呵呵,卖数据这个玩笑成分居多

如果觉得不是玩笑,俺也会很严肃的哦
作者: 狒狒    时间: 2010-11-2 14:46
提示: 作者被禁止或删除 内容自动屏蔽
作者: winsock    时间: 2010-11-2 14:50
你们太bt了。。。
作者: hepac    时间: 2010-11-2 14:57
会做站的不如会偷站的啊
作者: 大飞机    时间: 2010-11-2 14:57
24楼 猛 偶像 我要学习
作者: 乐哉    时间: 2010-11-2 15:46
哈哈,看到需求了!! 要不我去弄弄采集,然后卖给大家数据!!!  
作者: wzlm123    时间: 2010-11-2 15:57
自娱自乐, GOOGLE又不是傻X
作者: 挨个搞    时间: 2010-11-2 16:49
原帖由 wzlm123 于 2010-11-2 15:57 发表
自娱自乐, GOOGLE又不是傻X


采集之后要用你推荐的tbs改写的啊
不改写就发布,还真是傻×
作者: lsylsy2    时间: 2010-11-2 19:00
原帖由 挨个搞 于 2010-11-2 16:49 发表


采集之后要用你推荐的tbs改写的啊
不改写就发布,还真是傻×

还好不是手工伪原创,不然800W文章
作者: 挨个搞    时间: 2010-11-2 19:24
原帖由 lsylsy2 于 2010-11-2 19:00 发表

还好不是手工伪原创,不然800W文章


脚本在手,别无所求
一天改写个20多w的文章没问题
作者: GoTop    时间: 2010-11-2 19:40
原帖由 挨个搞 于 2010-11-2 19:24 发表


脚本在手,别无所求
一天改写个20多w的文章没问题


据说tbs有api可以调用....
作者: 挨个搞    时间: 2010-11-2 19:46
原帖由 GoTop 于 2010-11-2 19:40 发表


据说tbs有api可以调用....


恩,那个每天有限制的,好像每天最多250次请求
作者: eudx    时间: 2010-11-2 19:53
采集帝 改写帝
作者: efish    时间: 2010-11-2 21:47
英文很注重版权,只要有人举报你,你的日子也不会好过滴




欢迎光临 全球主机交流论坛 (https://lilynana.eu.org/) Powered by Discuz! X3.4