国产乱子伦高清露脸对白-国产精品欧美久久久久天天影视-国产91视频一区-亚洲欧美日产综合在线网-黄视频网站在线看-国产欧美亚洲精品第1页-亚洲www在线-大学生女人三级在线播放-日本在线视频www鲁啊鲁-国产成人精品一区二区仙踪林-69精品欧美一区二区三区-成人欧美亚洲-日本污污网站-中国妞xxxhd露脸偷拍视频-国产精品aⅴ在线观看-精品中文字幕在线

極客小將

您現在的位置是:首頁 » python編程資訊

資訊內容

python爬蟲:隨心所欲地爬取百度圖片

極客小將2021-03-05-
簡介文章目錄一、前言二、需要導入的庫三、實現過程1、下載鏈接分析2、代碼分析3、完整代碼四、Blogger'sspeech(免費學習推薦:python視頻教程)一、前言之前爬取了很多靜態網頁的內容,包括:小說、圖片等等,今天我來嘗試一下動態網頁的爬取。眾所周知,百度圖片就是一個動態網頁。那么,沖
ZYn少兒編程網-https://www.pxcodes.com

文章目錄ZYn少兒編程網-https://www.pxcodes.com

一、前言二、需要導入的庫三、實現過程1、下載鏈接分析2、代碼分析3、完整代碼四、Blogger's speech

(免費學習推薦:python視頻教程)ZYn少兒編程網-https://www.pxcodes.com

一、前言ZYn少兒編程網-https://www.pxcodes.com

之前爬取了很多靜態網頁的內容,包括:小說、圖片等等,今天我來嘗試一下動態網頁的爬取。眾所周知,百度圖片就是一個動態網頁。那么,沖!沖!!沖!!!ZYn少兒編程網-https://www.pxcodes.com

二、需要導入的庫ZYn少兒編程網-https://www.pxcodes.com

import requestsimport jsonimport os

三、實現過程ZYn少兒編程網-https://www.pxcodes.com

1、下載鏈接分析

首先,打開百度,搜索一個內容,這里搜索的是男神(本人 )——彭于晏

然后,打開抓包工具,選擇XHR選項,按Ctrl+R,然后你會發現,隨著你鼠標的滑動,右側會出現一個又一個的數據包。

(這里沒滑動太多,一開始因為滑動太多,錄的GIF超5M了)ZYn少兒編程網-https://www.pxcodes.com

然后,選一個包,查看它的headers,如圖:
ZYn少兒編程網-https://www.pxcodes.com

截取之后,粘貼在記事本上,作為一個URL,后文會用到。

這里有很多很多的參數,我也不知道具體哪些是可以忽略的,后文就索性全復制下來了,具體看后文。ZYn少兒編程網-https://www.pxcodes.com

到這里,能夠直接觀察到的內容就結束了,接下來,借助代碼,幫我們打開另一個世界的大門ZYn少兒編程網-https://www.pxcodes.com

沖就完事了!ZYn少兒編程網-https://www.pxcodes.com

2、代碼分析

首先:把上述中的“其它參數”組在一起。ZYn少兒編程網-https://www.pxcodes.com

自己做的話,**好復制自己的“其它參數”。ZYn少兒編程網-https://www.pxcodes.com

之后,我們可以先提取一下試試,并且把編碼格式改成'utf-8'ZYn少兒編程網-https://www.pxcodes.com

url = 'https://image.baidu.com/search/acjson?' param = { 'tn': 'resultjson_com', 'logid': ' 7517080705015306512', 'ipn': 'rj', 'ct': '201326592', 'is': '', 'fp': 'result', 'queryWord': '彭于晏', 'cl': '2', 'lm': '-1', 'ie': 'utf-8', 'oe': 'utf-8', 'adpicid': '', 'st': '', 'z': '', 'ic': '', 'hd': '', 'latest': '', 'copyright': '', 'word': '彭于晏', 's': '', 'se': '', 'tab': '', 'width': '', 'height': '', 'face': '', 'istype': '', 'qc': '', 'nc': '1', 'fr': '', 'expermode': '', 'force': '', 'cg': 'star', 'pn': '30', 'rn': '30', 'gsm': '1e', } # 將編碼形式轉換為utf-8 response = requests.get(url=url, headers=header, params=param) response.encoding = 'utf-8' response = response.text print(response)

運行結果如下:

看上去挺亂的哈,沒事,我們給包裝一下!ZYn少兒編程網-https://www.pxcodes.com

在上面的基礎上加上:ZYn少兒編程網-https://www.pxcodes.com

# 把字符串轉換成json數據 data_s = json.loads(response) print(data_s)

運行結果如下:

和上面相比,已經明晰很多了,但依舊不夠明確,為什么呢?因為它打印的格式不方便我們觀看! ZYn少兒編程網-https://www.pxcodes.com

對此,有兩種解決辦法。ZYn少兒編程網-https://www.pxcodes.com

①導入pprint庫,接著輸入pprint.pprint(data_s),就能打印啦,如下圖ZYn少兒編程網-https://www.pxcodes.com

ZYn少兒編程網-https://www.pxcodes.com

②使用json在線解析器(自行百度),結果如下:
ZYn少兒編程網-https://www.pxcodes.com

解決掉上一步,我們會發現,想要的數據都在data里面!ZYn少兒編程網-https://www.pxcodes.com

那么就提取吧!ZYn少兒編程網-https://www.pxcodes.com

a = data_s["data"] for i in range(len(a)-1): # -1是為了去掉上面那個空數據 data = a[i].get("thumbURL", "not exist") print(data)

結果如下:

到這里,已經成功90%啦,剩下的就是保存和優化代碼了!ZYn少兒編程網-https://www.pxcodes.com

3、完整代碼

這部分和上面有些許不同,仔細看看就會發現嗷!ZYn少兒編程網-https://www.pxcodes.com

# -*- coding: UTF-8 -*-""" @Author :遠方的星 @Time : 2021/2/27 17:49 @CSDN :https://blog.csdn.net/qq_44921056 @騰訊云 : https://cloud.tencent.com/developer/user/8320044 """import requestsimport jsonimport osimport pprint# 創建一個文件夾path = 'D:/百度圖片'if not os.path.exists(path): os.mkdir(path)# 導入一個請求頭header = { 'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 11_1_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'}# 用戶(自己)輸入信息指令keyword = input('請輸入你想下載的內容:')page = input('請輸入你想爬取的頁數:')page = int(page) + 1n = 0pn = 1# pn代表從第幾張圖片開始獲取,百度圖片下滑時默認一次性顯示30張for m in range(1, page): url = 'https://image.baidu.com/search/acjson?' param = { 'tn': 'resultjson_com', 'logid': ' 7517080705015306512', 'ipn': 'rj', 'ct': '201326592', 'is': '', 'fp': 'result', 'queryWord': keyword, 'cl': '2', 'lm': '-1', 'ie': 'utf-8', 'oe': 'utf-8', 'adpicid': '', 'st': '', 'z': '', 'ic': '', 'hd': '', 'latest': '', 'copyright': '', 'word': keyword, 's': '', 'se': '', 'tab': '', 'width': '', 'height': '', 'face': '', 'istype': '', 'qc': '', 'nc': '1', 'fr': '', 'expermode': '', 'force': '', 'cg': 'star', 'pn': pn, 'rn': '30', 'gsm': '1e', } # 定義一個空列表,用于存放圖片的URL image_url = list() # 將編碼形式轉換為utf-8 response = requests.get(url=url, headers=header, params=param) response.encoding = 'utf-8' response = response.text # 把字符串轉換成json數據 data_s = json.loads(response) a = data_s["data"] # 提取data里的數據 for i in range(len(a)-1): # 去掉**后一個空數據 data = a[i].get("thumbURL", "not exist") # 防止報錯key error image_url.append(data) for image_src in image_url: image_data = requests.get(url=image_src, headers=header).content # 提取圖片內容數據 image_name = '{}'.format(n+1) + '.jpg' # 圖片名 image_path = path + '/' + image_name # 圖片保存路徑 with open(image_path, 'wb') as f: # 保存數據 f.write(image_data) print(image_name, '下載成功啦!!!') f.close() n += 1 pn += 29

運行結果如下:


友情提示:
①:一頁是30張
②:輸入的內容可以很多變:比如橋、月亮、太陽、胡歌、趙麗穎等等。 ZYn少兒編程網-https://www.pxcodes.com

四、Blogger’s speechZYn少兒編程網-https://www.pxcodes.com

希望大家可以,點贊、關注、收藏,三連支持一下!ZYn少兒編程網-https://www.pxcodes.com

大量免費學習推薦,敬請訪問python教程(視頻)ZYn少兒編程網-https://www.pxcodes.com

以上就是python爬蟲:隨心所欲地爬取百度圖片的詳細內容,更多請關注少兒編程網其它相關文章!ZYn少兒編程網-https://www.pxcodes.com

預約試聽課

已有385人預約都是免費的,你也試試吧...

国产乱子伦高清露脸对白-国产精品欧美久久久久天天影视-国产91视频一区-亚洲欧美日产综合在线网-黄视频网站在线看-国产欧美亚洲精品第1页-亚洲www在线-大学生女人三级在线播放-日本在线视频www鲁啊鲁-国产成人精品一区二区仙踪林-69精品欧美一区二区三区-成人欧美亚洲-日本污污网站-中国妞xxxhd露脸偷拍视频-国产精品aⅴ在线观看-精品中文字幕在线

        av噜噜在线观看| 日本中文字幕在线不卡| 久久精品网站视频| 一区二区三区 欧美| 成人手机视频在线| 日本人妻伦在线中文字幕| jizzjizz国产精品喷水| 久久婷婷国产91天堂综合精品| 手机在线国产视频| 国产911在线观看| 欧美日韩在线视频一区二区三区| 牛夜精品久久久久久久| 8x8x华人在线| 亚洲黄色av网址| 日韩久久久久久久久久久久| 激情内射人妻1区2区3区| 夜夜爽久久精品91| 亚洲爆乳无码专区| 女女百合国产免费网站| www.日日操| 水蜜桃色314在线观看| 中文字幕在线观看日| 激情六月天婷婷| 天天干天天爽天天射| 国产毛片视频网站| 97超碰人人看| 日本人视频jizz页码69| 亚洲 高清 成人 动漫| 国产精品嫩草影视| 一道本视频在线观看| 国产精品无码人妻一区二区在线| 一本二本三本亚洲码| 精品久久久久久久无码| 欧洲精品一区二区三区久久| 亚洲第一精品区| 欧美一级特黄a| 熟女性饥渴一区二区三区| 日韩精品视频在线观看视频| ijzzijzzij亚洲大全| 一区二区三区 日韩| 黄色网络在线观看| 日韩av三级在线| 国产男女激情视频| 成人小视频在线看| 69久久久久久| 最新av网址在线观看| 国产性生活一级片| 成人免费在线视频播放| 久久久久久久中文| 国产精品88久久久久久妇女| 777一区二区| 9999在线观看| 国产成人在线综合| 国产又黄又猛又粗又爽的视频| www黄色av| 一区二区三区免费播放| 亚洲黄色av网址| 四季av一区二区三区| 浓精h攵女乱爱av| 亚洲污视频在线观看| 五月天av在线播放| 美女网站色免费| 天天久久综合网| 欧美性受xxxx黑人猛交88| 米仓穗香在线观看| 日韩久久久久久久久久久久| 免费拍拍拍网站| 99热在线这里只有精品| 男人插女人下面免费视频| 老司机久久精品| 可以免费看的黄色网址| 欧美一级欧美一级| 99福利在线观看| 午夜免费看视频| 免费日韩在线观看| 日韩激情免费视频| 亚洲一区二区蜜桃| 麻豆视频传媒入口| 亚洲午夜无码av毛片久久| 三级视频中文字幕| 天堂а√在线中文在线| 无码aⅴ精品一区二区三区浪潮| 天堂网在线免费观看| 精品无码av无码免费专区| 国产成人无码a区在线观看视频| av污在线观看| 97免费视频观看| 亚洲第一狼人区| 黄色一级片在线看| 在线观看国产一级片| 妞干网视频在线观看| www.com黄色片| 国产成人在线小视频| 粉色视频免费看| 国产青青在线视频| 国产精品波多野结衣| 99re在线视频免费观看| 日韩成人午夜影院| 天天干天天操天天做| 日韩精品一区在线视频| 欧美激情第四页| 日韩欧美xxxx| 欧美极品欧美精品欧美| 欧美日韩一级在线| 亚洲欧美日韩一级| 欧美日韩精品在线一区二区| 日本在线视频www色| 人人爽人人av| 亚洲人成色77777| 狠狠噜天天噜日日噜| 亚洲美女性囗交| 超碰av在线免费观看| 那种视频在线观看| 日本中文字幕网址| 在线观看18视频网站| 在线观看岛国av| 香蕉视频网站入口| 97视频在线免费播放| 久久视频这里有精品| 欧美黄网在线观看| 四虎精品欧美一区二区免费| 国产性生活一级片| 五月婷婷之婷婷| 色呦色呦色精品| 欧美成人福利在线观看| 亚洲精品怡红院| 亚洲欧美国产日韩综合| 成人在线看视频| 老熟妇仑乱视频一区二区| 激情综合在线观看| 久久精品香蕉视频| 免费黄色一级网站| 中文字幕有码av| 日韩在线一区视频| www.日本久久| 天堂а√在线中文在线| 青草全福视在线| 91免费国产精品| 青青草精品视频在线| 欧美牲交a欧美牲交aⅴ免费下载| 午夜精品久久久内射近拍高清| 天天碰免费视频| 中文字幕久久av| 超碰在线免费观看97| 日韩一区二区高清视频| 凹凸国产熟女精品视频| 别急慢慢来1978如如2| 午夜免费福利视频在线观看| 中文字幕av久久| 丰满少妇大力进入| 人妻丰满熟妇av无码区app| 黑人粗进入欧美aaaaa| 不卡中文字幕在线观看| 青青草免费在线视频观看| 国产欧美日韩网站| 冲田杏梨av在线| 日本黄色播放器| 日本网站免费在线观看| 黑森林精品导航| 九一免费在线观看| 日本黄色三级大片| 九九九九九国产| 亚洲人精品午夜射精日韩| 国产高潮免费视频| 一区二区三区四区免费观看| 国产免费毛卡片| 中文字幕55页| 成人久久久久久久久| 中文字幕免费高| 黄色国产小视频| 大陆极品少妇内射aaaaaa| 青青草精品视频在线观看| 在线观看三级网站| 欧美性猛交久久久乱大交小说 | 国产美女主播在线| 国产视频一区二区视频| 国产肉体ⅹxxx137大胆| 中文字幕av不卡在线| 欧日韩免费视频| 国产毛片久久久久久| 99热成人精品热久久66| 欧美交换配乱吟粗大25p| 亚洲欧美aaa| 91激情视频在线| 日本免费黄视频| 日本中文字幕在线视频观看 | 久久久久久三级| 国产爆乳无码一区二区麻豆| 久久久久久久久久一区二区| 欧美精品一区二区三区免费播放| 激情六月天婷婷| 黄色a级在线观看| 日本高清一区二区视频| 日本老熟妇毛茸茸| www.玖玖玖| 天天夜碰日日摸日日澡性色av| 日韩在线观看a| 欧美这里只有精品| 黄黄视频在线观看| 国产又粗又大又爽的视频|