全球主机交流论坛

标题: 发个无聊之作,自己专用的网站模版抓取器 [打印本页]

作者: 哥坏人    时间: 2011-10-4 13:14
标题: 发个无聊之作,自己专用的网站模版抓取器
本帖最后由 哥坏人 于 2012-1-2 12:51 编辑


[ 本帖最后由 哥坏人 于 2011-10-4 16:57 编辑 ]
作者: lazyzhu    时间: 2011-10-4 13:15
可以WP吗
作者: 哥坏人    时间: 2011-10-4 13:16
不知道,能用则用,不能则删
作者: funkys    时间: 2011-10-4 13:17
我一直不知道扒皮是怎么扒法,是直接下载CSS,查看源文件?
作者: lazyzhu    时间: 2011-10-4 13:17
原帖由 哥坏人 于 2011-10-4 13:16 发表
不知道,能用则用,不能则删

自己写的都不知道?
作者: 有容乃大    时间: 2011-10-4 13:31

作者: 四师兄    时间: 2011-10-4 13:32
如何用呢?
作者: qun    时间: 2011-10-4 13:34
坏人mjj不是说好不发布的吗
作者: vip1    时间: 2011-10-4 13:45
收藏了哈
作者: 哥坏人    时间: 2011-10-4 13:45
标题: 回复 7# 四师兄 的帖子
点新建任务  填入目标域名   点初始化  开始
作者: Satoshi    时间: 2011-10-4 13:47
好东西,待会试试
作者: cnx    时间: 2011-10-4 13:58
刚试了一下.
作者: 一直在寻找    时间: 2011-10-4 14:05
求加分
作者: ali727    时间: 2011-10-4 14:45
还是自己手动好了,这个软件用起来不大顺手
作者: xen    时间: 2011-10-4 15:00
wangwang.taobao.com
此页面天下无一款软件能扒,刚试了下楼主的也无效(没扒全)
作者: lovehz1wn    时间: 2011-10-4 15:03
原帖由 xen 于 2011-10-4 15:00 发表
wangwang.taobao.com
此页面天下无一款软件能扒,刚试了下楼主的也无效(没扒全)

人工都不行~?
作者: games    时间: 2011-10-4 15:05
原帖由 哥坏人 于 2011-10-4 13:14 发表
  有部分傻 B杀毒会报。。欲试不欲。出什么事情,与本人无关。 软件还不是很完善,
http://115.com/file/clsbtakb

不就是多年前的整站下载器吗
作者: cdm    时间: 2011-10-4 15:10
提示: 作者被禁止或删除 内容自动屏蔽
作者: cdm    时间: 2011-10-4 15:15
提示: 作者被禁止或删除 内容自动屏蔽
作者: Porter    时间: 2011-10-4 15:40
标题: 回复 19# cdm 的帖子
用firebug或chrome看看js的调用关系。
作者: cdm    时间: 2011-10-4 15:43
提示: 作者被禁止或删除 内容自动屏蔽
作者: 哥坏人    时间: 2011-10-4 17:07
标题: 回复 15# xen 的帖子
扒不到的东西,自己在看看哪里缺了 ,补上。
这软件是用来省去扒版时间,太牛B的活 它干不了
刚出炉,采集规则还不多。


那个首页的这部分代码 软件没去做处理 ( 所以缺失http://a.tbcdn.cn/s/ac.js http://a.tbcdn.cn/s/atp.js
<body id="ww_body"><script type="text/javascript">
(function (d) {
var ta=d.createElement("script");ta.type="text/javascript";ta.async=true;ta.id="tb-beacon-ac";
ta.setAttribute("exparams","category=&userid=&channel=112&&stats_show=");
ta.src=("https:"==d.location.protocol?"https://s":"http://a")+".tbcdn.cn/s/ac.js";
d.getElementsByTagName("head")[0].appendChild(ta);
})(document);
</script>
<script type="text/javascript">
(function (d) {
var ta=d.createElement("script");ta.type="text/javascript";ta.async=true;ta.id="tb-beacon";
ta.setAttribute("exparams","category=&userid=&tid=14f1f9c3fb601af2a047bf57da577ff8&channel=112&&stats_show=");
ta.src=("https:"==d.location.protocol?"https://s":"http://a")+".tbcdn.cn/s/atp.js";
d.getElementsByTagName("head")[0].appendChild(ta);
})(document);
</script>

[ 本帖最后由 哥坏人 于 2011-10-4 17:13 编辑 ]
作者: 哥坏人    时间: 2011-10-4 17:16
标题: 回复 14# ali727 的帖子
  我之前也都是手动,拔得蛋疼
作者: geyunbing    时间: 2011-10-4 17:18
提示: 作者被禁止或删除 内容自动屏蔽
作者: wr浅唱    时间: 2011-10-4 17:28
原帖由 xen 于 2011-10-4 15:00 发表
wangwang.taobao.com
此页面天下无一款软件能扒,刚试了下楼主的也无效(没扒全)


用软件可能真的是扒不了,人工倒是搞得出来
作者: greyboy    时间: 2011-10-4 17:34
Mark
作者: mfch666    时间: 2011-10-5 03:01
易语言论坛里开源的  鉴定完毕
修改下界面和版权结束
作者: 一跳而过    时间: 2011-10-5 04:09
原帖由 lazyzhu 于 2011-10-4 13:15 发表
可以WP吗

作者: loveni    时间: 2011-10-5 06:07

作者: G.Ming    时间: 2011-10-5 06:35
原帖由 xen 于 2011-10-4 15:00 发表
wangwang.taobao.com
此页面天下无一款软件能扒,刚试了下楼主的也无效(没扒全)

简单
作者: 雪花烂饼子    时间: 2011-10-5 08:57
原帖由 mfch666 于 2011-10-5 03:01 发表
易语言论坛里开源的  鉴定完毕
修改下界面和版权结束

作者: dearroy    时间: 2011-10-5 09:18
500 Internal Server Error

nginx


115也会这样?
作者: 哥坏人    时间: 2011-10-5 09:43
标题: 回复 27# mfch666 的帖子
原帖由 mfch666 于 2011-10-5 03:01 发表
易语言论坛里开源的  鉴定完毕
修改下界面和版权结束
????????????????????????????????

睁大你的狗眼,还坚定完毕呢,

我这个是来源于什么开源软件改了界面的??????????????
作者: 弓虽女干    时间: 2011-10-5 09:54
好东西.试试
作者: haoqiumi    时间: 2011-10-5 13:01
感谢楼主
作者: qxwo    时间: 2011-10-5 13:16
大部分网页离线浏览器都行
作者: hitsword    时间: 2011-10-5 17:20
Mark
作者: esited_小江    时间: 2011-10-5 17:22
原帖由 geyunbing 于 2011-10-4 17:18 发表
  下载看看

作者: zzyxz    时间: 2011-10-7 13:22
原帖由 xen 于 2011-10-4 15:00 发表
wangwang.taobao.com
此页面天下无一款软件能扒,刚试了下楼主的也无效(没扒全)


这种也只能手工来




欢迎光临 全球主机交流论坛 (https://lilynana.eu.org/) Powered by Discuz! X3.4