QQ登录

只需一步,快速开始

搜索
鱼C论坛笔记大赛成绩公示
查看: 59|回复: 2

关于scrapy xpath的问题 有大大来解惑一下吗

[复制链接]
最佳答案
3 
累计签到:6 天
连续签到:1 天
发表于 2017-9-13 15:14:22 | 显示全部楼层 |阅读模式

马上注册加入鱼C,享用更多服务吧^_^

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
在用xpath 定位需爬取信息的时候 出现了以下问题:
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li').extract()
出现的是下图
QQ图片20170913150827.png
得到了我要爬取的内容 而且能解析出来的话是很规整的都是我想要的
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li/text()').extract()
出现了下图
QQ图片20170913150845.png
我的白天 夜晚 就这样被吃了 如果单独其中每一项可以完成 但是 阴 多云 这些就会被吃掉
下面是网页结构截图 希望大大帮我看看是怎么回事
QQ图片20170913151320.png
1. 如果您的提问得到满意的答案,请务必选择【最佳答案】;2. 如果想鼓励一下楼主或帮助到您的朋友,可以给他们【评分】作为奖励;
3. 善用【论坛搜索】功能,那里可能有您想要的答案;4. 粘贴代码请点击编辑框上的 <> 按钮,否则您的代码可能会被“吃掉”!
最佳答案
3 
累计签到:6 天
连续签到:1 天
 楼主| 发表于 2017-9-13 16:02:08 | 显示全部楼层
查了好久 终于查到了
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li/descentand::text()').extract()

直接用text并不能解析出 子节点的内容  所以要用 descentand 或者 //text()
1. 如果您的提问得到满意的答案,请务必选择【最佳答案】;2. 如果想鼓励一下楼主或帮助到您的朋友,可以给他们【评分】作为奖励;
3. 善用【论坛搜索】功能,那里可能有您想要的答案;4. 粘贴代码请点击编辑框上的 <> 按钮,否则您的代码可能会被“吃掉”!
最佳答案
9 
累计签到:198 天
连续签到:1 天
发表于 2017-9-13 23:57:40 | 显示全部楼层
多看几遍 W3C的Xpath教程 就看出来了
1. 如果您的提问得到满意的答案,请务必选择【最佳答案】;2. 如果想鼓励一下楼主或帮助到您的朋友,可以给他们【评分】作为奖励;
3. 善用【论坛搜索】功能,那里可能有您想要的答案;4. 粘贴代码请点击编辑框上的 <> 按钮,否则您的代码可能会被“吃掉”!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

小甲鱼强烈推荐上一条 /1 下一条

小黑屋手机版Archiver( 粤公网安备 44051102000370号 | 粤ICP备11014136号

© 2010-2017 FishC.com GMT+8, 2017-9-27 02:08 Powered by Discuz! X2.5 Theme by dreambred

快速回复 返回顶部 返回列表