text组件显示延迟问题

python黑帽 · 发表于 2016-7-20 09:32:18

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由 python黑帽于 2016-7-21 21:02 编辑

用tk做了个爬图片的爬虫，本来是下载一张就显示一张图片的链接，但是现在点击开始下载后程序就会无响应，然后等下载完了才把信息一下都显示出来
，进过debug发现是下载函数那里有问题，但是不知道是什么问题，反正没有那句的话显示其他信息就是同步的，贴上代码让各位大神看看

import urllib.request
import re
import os
import urllib.parse
import requests
from tkinter import *
os.mkdir('E:/search_picture/')
root=Tk()
screen=Text(root,height=4,width=110)
screen.pack()
screen.insert(INSERT,"输入查找关键词:")
screen2=Text(root,height=8,width=110)
screen2.pack()
def run():
count = 1
key=screen.get(1.0,END)
key=key.split(':')[1]
root_url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%s&pn=0&gsm=500000064' % (
str(urllib.parse.quote(key)) + '%e5%a3%81%e7%ba%b8')
picture_url = []
html = requests.get(root_url).text
picture_url = re.findall('"objURL":"(.*?)",', html, re.S)
path = 'E:/search_picture/%d.jpg' % count
for url in picture_url:
try:
#经过debug发现是下面这句代码的问题，但是不知道什么问题，反正没有下面这句显示其他东西就是正常的
urllib.request.urlretrieve(url, path)
screen2.insert(INSERT,'正在下载第%d张:%s\n' % (count, url))
count = count + 1
path = 'E:/search_picture/%d.jpg' % count
except:
screen2.insert(INSERT,'当前图片链接不可用\n')
screen2.insert(INSERT,'下载完成，%d张图片保存在E盘search_picture文件夹\n'%count)
bot=Button(root,text='开始下载',command=run)
bot.pack()
mainloop()

复制代码

感谢SixPy的帮助，问题已解决，贴上代码

import urllib.request
import re
import os
import urllib.parse
import requests
from tkinter import *
import threading
os.mkdir('E:/search_picture/')
root=Tk()
screen=Text(root,height=4,width=110)
screen.pack()
screen.insert(INSERT,"输入查找关键词:")
screen2=Text(root,height=8,width=110)
screen2.pack()
def down(urls):
count = 1
for url in urls:
try:
path = 'E:/search_picture/%d.jpg' % count
urllib.request.urlretrieve(url,path)
screen2.insert(INSERT,"正在下载第%d张：%s\n"%(count,url))
count = count+1
except:
screen2.insert(INSERT,"当前图片链接不可用\n")
def run():
count = 1
key=screen.get(1.0,END)
key=key.split(':')[1]
root_url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=%s&pn=0&gsm=500000064' % (
str(urllib.parse.quote(key)) + '%e5%a3%81%e7%ba%b8')
picture_url = []
html = requests.get(root_url).text
picture_url = re.findall('"objURL":"(.*?)",', html, re.S)
p = threading.Thread(target=down,args=(picture_url,))
p.start()
bot=Button(root,text='开始下载',command=run)
bot.pack()
mainloop()

复制代码

SixPy · 发表于 2016-7-20 09:53:19

改为非阻塞的多线程下载

把下载功能用一个线程来完成

python黑帽 · 发表于 2016-7-20 20:54:23

SixPy 发表于 2016-7-20 09:53
改为非阻塞的多线程下载

把下载功能用一个线程来完成

额。。不是很理解，不过先自己鼓捣一下

python黑帽 · 发表于 2016-7-21 10:06:30

SixPy 发表于 2016-7-20 09:53
改为非阻塞的多线程下载

把下载功能用一个线程来完成

按照你的建议（其实不是很理解）改了一下代码变成这样，还是不行，你的做法具体应该怎么搞？可否详细说明？

python黑帽 · 发表于 2016-7-21 10:07:03

SixPy 发表于 2016-7-20 09:53
改为非阻塞的多线程下载

把下载功能用一个线程来完成

这是代码http://paste.ubuntu.com/20259243/

轻描淡写’ · 发表于 2016-7-21 11:24:30

SixPy · 发表于 2016-7-21 12:36:38

python黑帽发表于 2016-7-21 10:07
这是代码http://paste.ubuntu.com/20259243/

把 down() 放到线程中执行，并插入文本到 text
注意用 lock

python黑帽 · 发表于 2016-7-21 16:36:56

SixPy 发表于 2016-7-21 12:36
把 down() 放到线程中执行，并插入文本到 text
注意用 lock

感谢，问题已解决。只是仍然不明白为什么放在线程里面就可以解决延迟，不都是等图片下载完后才进行插入文本么，为什么会出现延迟现象呢？

SixPy · 发表于 2016-7-21 16:46:07

python黑帽发表于 2016-7-21 16:36
感谢，问题已解决。只是仍然不明白为什么放在线程里面就可以解决延迟，不都是等图片下载完后才进行插入文 ...

解决了就把代码贴出来啊~

urllib 是阻塞式IO，当前进程会一直等它下载完成才恢复执行。所有你看到文本都是在完成后同时显示出来。
把每张图片用一个线程来下载，就不要等那么久了~

python黑帽 · 发表于 2016-7-21 21:03:03

SixPy 发表于 2016-7-21 16:46
解决了就把代码贴出来啊~

urllib 是阻塞式IO，当前进程会一直等它下载完成才恢复执行。所有你看到文 ...

代码已贴，感谢解答

SixPy · 发表于 2016-7-22 10:12:39

多线程下载图片，以及界面互动~
http://bbs.fishc.com/thread-74052-1-1.html
(出处: 鱼C论坛)

keda_zz · 发表于 2016-8-1 22:47:04

支持，不错的爬虫脚本，都可以使用，赞！

账号		自动登录	找回密码
密码			立即注册