鱼C论坛

 找回密码
 立即注册
查看: 2050|回复: 2

关于scrapy xpath的问题 有大大来解惑一下吗

[复制链接]
发表于 2017-9-13 15:14:22 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
在用xpath 定位需爬取信息的时候 出现了以下问题:
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li').extract()
出现的是下图
QQ图片20170913150827.png
得到了我要爬取的内容 而且能解析出来的话是很规整的都是我想要的
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li/text()').extract()
出现了下图
QQ图片20170913150845.png
我的白天 夜晚 就这样被吃了 如果单独其中每一项可以完成 但是 阴 多云 这些就会被吃掉
下面是网页结构截图 希望大大帮我看看是怎么回事
QQ图片20170913151320.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2017-9-13 16:02:08 | 显示全部楼层
查了好久 终于查到了
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li/descentand::text()').extract()

直接用text并不能解析出 子节点的内容  所以要用 descentand 或者 //text()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-9-13 23:57:40 | 显示全部楼层
多看几遍 W3C的Xpath教程 就看出来了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-8 22:37

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表