QQ登录

只需一步,快速开始

登录 | 立即注册 | 找回密码

主题

帖子

荣誉

VIP至尊会员

Rank: 15Rank: 15Rank: 15

积分
91
查看: 113|回复: 2

关于scrapy xpath的问题 有大大来解惑一下吗

[复制链接]
最佳答案
3 
累计签到:7 天
连续签到:1 天
丢丢yhj 发表于 2017-9-13 15:14:22 1132 | 显示全部楼层 |阅读模式

马上注册加入鱼C,享用更多服务吧^_^

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
在用xpath 定位需爬取信息的时候 出现了以下问题:
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li').extract()
出现的是下图
QQ图片20170913150827.png
得到了我要爬取的内容 而且能解析出来的话是很规整的都是我想要的
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li/text()').extract()
出现了下图
QQ图片20170913150845.png
我的白天 夜晚 就这样被吃了 如果单独其中每一项可以完成 但是 阴 多云 这些就会被吃掉
下面是网页结构截图 希望大大帮我看看是怎么回事
QQ图片20170913151320.png
楼层
跳转到指定楼层
最佳答案
3 
累计签到:7 天
连续签到:1 天
丢丢yhj  楼主| 发表于 2017-9-13 16:02:08 | 显示全部楼层
查了好久 终于查到了
sel.xpath('//div/div/div/div[@class = "table_day15"]/ul/li/descentand::text()').extract()

直接用text并不能解析出 子节点的内容  所以要用 descentand 或者 //text()
最佳答案
12 
累计签到:198 天
连续签到:1 天
、尾指一勾 发表于 2017-9-13 23:57:40 | 显示全部楼层
多看几遍 W3C的Xpath教程 就看出来了

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

小甲鱼强烈推荐 上一条 /1 下一条

    移动客户端下载(未启用)
    微信公众号

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备11014136号

Copyright 2018 鱼C论坛 版权所有 All Rights Reserved.

Powered by Discuz! X3.1 Copyright
© 2001-2018 Comsenz Inc.    All Rights Reserved.

小黑屋|手机版|Archiver|鱼C工作室 ( 粤公网安备 44051102000370号 | 粤ICP备11014136号

GMT+8, 2017-11-24 02:43

快速回复 返回顶部 返回列表