小白求助爬虫问题，求大神解答一下，感谢！,Python交流,技术交流,鱼C论坛

silence181 发表于 2018-1-19 11:22:33

小白求助爬虫问题，求大神解答一下，感谢！

代码如下，运行的话不报错，但是也没有东西输出来，中间加了几个print也是什么东西都没有！输出：Process finished with exit code 0爬的豆瓣电影https://movie.douban.com/chart
import requests
import re
import json

heads = 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36'

#获取网页
def get_page(url):
response = requests.get(url,heads)
return response.text

#解析网页
def re_html(html):
r = re.compile('<table.*?class="p1">(.*?)</span>.*?</table>',re.S)#正则暂时获取总评论人数
item = re.findall(r,html)
print(item)
for i in item:
   yield {
         'name':i,
         # 'start':i,
         # 'num':i
   }

#写入txt
def writedata(context):
with open('0.txt','a',encoding='utf-8') as f:
   f.write(json.dumps(context,ensure_ascii=False) + '\n')
   f.close()

#主函数
def main():
url = 'https://movie.douban.com/chart/'
html = get_page(url)
for x in re_html(html):
   print (x)
   writedata(x)

if __name__ == '__mian__':
main()

sky 发表于 2018-1-19 11:40:06

倒数第二行的main写错了

ba21 发表于 2018-1-19 11:40:18

if __name__ == '__main__':
main()

silence181 发表于 2018-1-19 11:45:02

sky 发表于 2018-1-19 11:40
倒数第二行的main写错了

.........我去找了一个早上了。。。。。

silence181 发表于 2018-1-19 12:38:09

ba21 发表于 2018-1-19 11:40
if __name__ == '__main__':
main()

谢谢

页: [1]

鱼C论坛's Archiver

小白求助爬虫问题，求大神解答一下，感谢！