全球主机交流论坛
标题:
求dedecms采集匹配规则
[打印本页]
作者:
litter123
时间:
2017-3-12 08:59
标题:
求dedecms采集匹配规则
遇到一个段落,(.*)匹配不了,应该用什么代码啊啊啊啊啊啊啊啊
<th>小说作者</th>(这里怎么破啊)
<td> [内容]</td>
复制代码
作者:
泡沫
时间:
2017-3-12 09:09
th前面是什么标签,有没有id或者name
作者:
litter123
时间:
2017-3-12 09:20
泡沫 发表于 2017-3-12 09:09
th前面是什么标签,有没有id或者name
<tbody><tr>
<th>小说类别</th>
<td> <a href="/list/1_1.html">玄幻魔法</a></td>
<th>小说作者</th>
<td> 爱潜水的乌贼</td>
<th>小说状态</th>
<td> 连载中</td></tr><tr>
<th>收 藏 数</th>
<td> 383</td>
<th>全文长度</th>
<td> 2745692字</td>
<th>最后更新</th>
<td> 17-03-11</td></tr>
<tr>
<th>总点击数</th>
<td> 169353</td>
<th>本月点击</th>
<td> 3707</td>
<th>本周点击</th>
<td> 2018</td></tr>
<tr>
<th>总推荐数</th>
<td> 518</td>
<th>本月推荐</th>
<td> 24</td>
<th>本周推荐</th>
<td> 12</td></tr>
</tbody>
复制代码
作者:
今晚我是你的
时间:
2017-3-12 09:25
前面用个用\s*
给我点分让我元老啊
作者:
泡沫
时间:
2017-3-12 09:29
本帖最后由 泡沫 于 2017-3-12 09:31 编辑
杰奇的模板小说详情页 body上面都有以下标签,你看你采集的有没有
<meta property="og:novel:category" content="玄幻小说"/>
<meta property="og:novel:author" content="天蚕土豆"/>
<meta property="og:novel:book_name" content="大主宰"/>
<meta property="og:novel:status" content="连载中"/>
<meta property="og:novel:author_link" content="天蚕土豆"/>
复制代码
作者:
litter123
时间:
2017-3-12 09:59
今晚我是你的 发表于 2017-3-12 09:25
前面用个用\s*
给我点分让我元老啊
dedecms支持正则?怎么我试其他的正则不行啊
欢迎光临 全球主机交流论坛 (https://lilynana.eu.org/)
Powered by Discuz! X3.4