鱼C论坛

 找回密码
 立即注册
查看: 13541|回复: 124

[作品展示] 分享自己写的养眼美图爬虫~

  [复制链接]
发表于 2017-2-8 11:23:13 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
前一段时间学习了urllib模块 ,手痒痒写了一个养眼的美图爬虫,主要是爬取美图网站的妹子图,并且摘取标题为图片名称,由于发现网站是由发图日期排序的 所以保存在了以跟新时间命名的文件夹,以备以后长期的定时更新妹子图片 不过这个真的是懒得写了 ,新手分享,寻求鼓励呦~

创建文件夹

创建文件夹
import urllib.request
import re
import os
path = os.getcwd()

request = urllib.request.urlopen('http://www.zdt8.com/new/')
req = request.read().decode('utf-8')
q = re.compile ('http://pic1.zdt8.com/p/\d*?-\d*?-\d*?/\w*?.jpg')

f_name = re.compile ('alt=".*?"')
f_name_list =f_name.findall(req)
f_name_list.remove (f_name_list[0])
m = q.findall(req)
big_pic_url = re.compile ('http://www.zdt8.com/meitu/\w*?.html')
all_url = big_pic_url.findall (req)
def fun (urllist,num):
   
   
    w = []
    for url2 in urllist:
        w.append(url2[8:])
        print (w[0][23:33])
        
    print ('第%d张o(* ̄▽ ̄*)o'%(num))
   
        
    return w
   
def get_bigpic(url_list):
    q= []
    a= 1
    for url in url_list:
        
        
        
        request = urllib.request.urlopen(url)
        req1 = request.read().decode('utf-8')
        big_p_url = re.compile ('lazysrc=http://pic1.zdt8.com/p/\d*?-\d*?-\d*?/\w*?.jpg')
        
        url = big_p_url.findall(req1)
        
        
        q.extend(fun(url,a))
        a+=1
   
   
        
   
    return q
   
q1 = get_bigpic(all_url)

os.makedirs (path+'\\'+m[0][28:33])

os.chdir (path+'\\'+m[0][28:33])


def a (url_list,name):
    a=0
    print('*********************正在保存到本地******************************')
    for url in url_list:
        




        response = urllib.request.Request (url)
        rs = urllib.request .urlopen (response)
        f = open(name[a][5:-1]+'.jpg','wb')
        f.write(rs.read())
        f.close()
        a= a+1
    print('保存成功')
      
a(q1,f_name_list)

图片内容

图片内容
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-2-8 12:42:42 | 显示全部楼层
来学习了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 12:44:10 | 显示全部楼层
怎么用啊,小白不清楚,能说的详细点吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 12:45:38 | 显示全部楼层
hao dongxi
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 12:49:32 | 显示全部楼层
哦哦,会用了,直接复制粘贴到PYthon中,保存再运行
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 15:09:11 | 显示全部楼层
23333
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 15:14:27 | 显示全部楼层
不错噢~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 15:57:22 | 显示全部楼层
可以啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 16:52:39 | 显示全部楼层
学习学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 17:00:20 | 显示全部楼层
学习学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-8 19:01:05 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-2-8 23:34:50 | 显示全部楼层
huifu huifu
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-9 08:17:22 | 显示全部楼层
不错不错,支持~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-9 09:13:55 | 显示全部楼层
学习学习。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-9 09:53:46 | 显示全部楼层
6666666666
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-9 10:21:42 | 显示全部楼层
厉害了,舅服你
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-9 10:25:15 | 显示全部楼层
学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-2-9 15:03:22 | 显示全部楼层
DDDDDDDDDDDDDDDDDDDDDDDDDDDDDDDD
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-2-9 19:57:34 | 显示全部楼层
看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-2-9 20:32:21 | 显示全部楼层
999
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-19 11:29

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表