|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
任务要求:通过 re 匹配 bSoup 中文本的内容,并返回父标签。
目标链接:https://www.amazon.com/KCOOL-Converter-Output-Video-Adapter/dp/B01M3P1GP8/ref=sr_1_1_sspa?ie=UTF8&qid=1510627731&sr=8-1-spons&keywords=wii+to+hdmi&psc=1
在 查看器(Elements)中搜索 “Best Sellers Rank”,出现如下图所示内容:
图片中蓝色那一行,就是我需要的父标签。
目标父标签“tr”下的“th”标签中有需要用 re 匹配的 “Best Sellers Rank”文本。
目前遇到的问题主要有以下几点:
1. 目标文本并不是纯粹的文本。
文本最前有一个换行符。
换行符后面,“Best”字符前面,可能会有其它英文字符以及空格。
“Rank”字符后面会有大量空格并以换行符结尾。
用print打印出来是下图的样子:
题主想要做到的是用 re 能匹配上这个文本
2. 通过匹配到的文本,返回其父标签(第一幅图中蓝色的 tr 标签),然后打印出父标签中text内容。
题主想要打印出下图中的效果 tr 标签下的 text 内容:
ps:文中的图片是使用标签的方法打印出来的,但是实际中,这个网页页面有很多种板式,唯一不变的只有 “Best Sellers Rank”这个文本。
我也知道各位时间都很宝贵,所以并不一定需要写详尽的方法,只要是参考资料、相关资料的链接都是非常感谢的。
拜谢! o(∩_∩)o
soup.find(name=True,string=re.compile(r'Best Sellers Rank')).parent
|
|