鱼C论坛

 找回密码
 立即注册
查看: 1187|回复: 4

[已解决]请前辈指点 python55课后题 第2题 class_

[复制链接]
发表于 2018-1-19 19:03:53 | 显示全部楼层 |阅读模式
10鱼币
  1. import urllib.request
  2. import urllib.parse
  3. import re
  4. from bs4 import BeautifulSoup

  5. def test_url(soup):
  6.     result = soup.find(text=re.compile("百度百科尚未收录词条"))
  7.     if result:
  8.         print(result[0:-1]) # 百度这个碧池在最后加了个“符号,给它去掉
  9.         return False
  10.     else:
  11.         return True

  12. def summary(soup):
  13.     word = soup.h1.text
  14.     # 如果存在副标题,一起打印
  15.     if soup.h2:
  16.         word += soup.h2.text
  17.     # 打印标题
  18.     print(word)
  19.     # 打印简介
  20.     if soup.find(class_="lemma-summary"):------------------>请问class_是什么,"lemma-summary"是什么,这句的作用?
  21.         print(soup.find(class_="lemma-summary").text)   

  22. def get_urls(soup):
  23.     for each in soup.find_all(href=re.compile("view")):
  24.         content = ''.join([each.text])
  25.         url2 = ''.join(["http://baike.baidu.com", each["href"]])
  26.         response2 = urllib.request.urlopen(url2)
  27.         html2 = response2.read()
  28.         soup2 = BeautifulSoup(html2, "html.parser")
  29.         if soup2.h2:
  30.             content = ''.join([content, soup2.h2.text])
  31.         content = ''.join([content, " -> ", url2])
  32.         yield content
  33.         

  34. def main():
  35.     word = input("请输入关键词:")
  36.     keyword = urllib.parse.urlencode({"word":word})
  37.     response = urllib.request.urlopen("http://baike.baidu.com/search/word?%s" % keyword)
  38.     html = response.read()
  39.     soup = BeautifulSoup(html, "html.parser")

  40.     if test_url(soup):
  41.         summary(soup)
  42.         
  43.         print("下边打印相关链接:")
  44.         each = get_urls(soup)
  45.         while True:
  46.             try:
  47.                 for i in range(10):
  48.                     print(next(each))
  49.             except StopIteration:
  50.                 break
  51.             
  52.             command = input("输入任意字符将继续打印,q退出程序:")
  53.             if command == 'q':
  54.                 break
  55.             else:
  56.                 continue
  57.    
  58. if __name__ == "__main__":
  59.     main()
复制代码



原贴地址:http://bbs.fishc.com/thread-72044-1-1.html
最佳答案
2018-1-19 19:03:54
div那个有一个class

最佳答案

查看完整内容

div那个有一个class
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-1-19 19:03:54 | 显示全部楼层    本楼为最佳答案   
div那个有一个class
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-1-19 19:51:21 | 显示全部楼层
寻找此页面中class标签为lemma-summary的内容。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2018-1-19 20:32:37 | 显示全部楼层
新手·ing 发表于 2018-1-19 19:51
寻找此页面中class标签为lemma-summary的内容。

请问这里不是要找猪八戒的简介 ,和lemma-summary有什么关系?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-1-19 20:46:43 | 显示全部楼层
wow7jiao 发表于 2018-1-19 20:32
请问这里不是要找猪八戒的简介 ,和lemma-summary有什么关系?

AE35})ZO0}Z99_I`~0WXV.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-20 03:10

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表