国产乱子伦高清露脸对白-国产精品欧美久久久久天天影视-国产91视频一区-亚洲欧美日产综合在线网-黄视频网站在线看-国产欧美亚洲精品第1页-亚洲www在线-大学生女人三级在线播放-日本在线视频www鲁啊鲁-国产成人精品一区二区仙踪林-69精品欧美一区二区三区-成人欧美亚洲-日本污污网站-中国妞xxxhd露脸偷拍视频-国产精品aⅴ在线观看-精品中文字幕在线

極客小將

您現在的位置是:首頁 » python編程資訊

資訊內容

介紹python爬取網頁

極客小將2021-03-10-
簡介之前在網上也寫了不少關于爬蟲爬取網頁的代碼,最近還是想把寫的爬蟲記錄一下,方便大家使用吧!代碼一共分為4部分:第一部分:找一個網站。我這里還是找了一個比較簡單的網站,就是大家都知道的https://movie.douban.com/top250?start=大家可以登錄里面看一下。這里大家可能會有一
3SL少兒編程網-https://www.pxcodes.com

之前在網上也寫了不少關于爬蟲爬取網頁的代碼,**近還是想把寫的爬蟲記錄一下,方便大家使用吧!3SL少兒編程網-https://www.pxcodes.com

代碼一共分為4部分:3SL少兒編程網-https://www.pxcodes.com

第一部分:找一個網站。3SL少兒編程網-https://www.pxcodes.com

我這里還是找了一個比較簡單的網站,就是大家都知道的https://movie.douban.com/top250?start= 大家可以登錄里面看一下。

這里大家可能會有一些庫沒有進行安裝,先上圖讓大家安裝完爬取網頁所需要的庫,其中我本次用到的庫有:bs4,urllib,xlwt, re。3SL少兒編程網-https://www.pxcodes.com

(免費學習推薦:python視頻教程)3SL少兒編程網-https://www.pxcodes.com

如圖3SL少兒編程網-https://www.pxcodes.com



這里選擇file-setting-Project-然后選擇左下角的加號,自行去安裝自己所需要的文件就可以了。3SL少兒編程網-https://www.pxcodes.com

下面的代碼是爬取網頁的源代碼:3SL少兒編程網-https://www.pxcodes.com

import urllib.requestfrom bs4 import BeautifulSoupimport xlwtimport redef main(): # 爬取網頁 baseurl = 'https://movie.douban.com/top250?start=' datalist = getData(baseurl) savepath = '豆瓣電影Top250.xls' # 保存數據 saveData(datalist,savepath) # askURL("https://movie.douban.com/top250?start=1")#影片詳情的規則findLink = re.compile(r'<a class="" href="(.*?)">') #創建從正則表達式,表示規則findImgSrc = re.compile(r'<img.*src="(.*?)"', re.S) #讓換行符匹配到字符中#影片的片名finTitle = re.compile(r'<span class="title">(.*)</span>')#影片的評分findReating = re.compile(r'<span class="rating_num" property="v:average">(.*)</span>')#找到評價人數findJudge = re.compile(r'<span>(d*)人評價</span>')#找到概況findInq = re.compile(r'<span class="inq">(.*)</span>')#找到影片的相關內容findBb = re.compile(r'<p class="">(.*?)</p>', re.S)#re.S忽視換行符

第二部分:爬取網頁。3SL少兒編程網-https://www.pxcodes.com

def getData(baseurl): datalist = [] for i in range(0, 10): url = baseurl + str(i*25) html = askURL(url) #保存獲取到的網頁源碼 #對網頁進行解析 soup = BeautifulSoup(html, 'html.parser') for item in soup.find_all('p', class_="item"): #查找符合要求的字符串 形成列表 #print(item) #測試查看電影信息 data = [] item = str(item) link = re.findall(findLink, item)[0] #re庫用來查找指定的字符串 data.append(link) imgSrc = re.findall(findImgSrc, item)[0] data.append(imgSrc) #添加圖片 titles = re.findall(finTitle, item) # if (len(titles) == 2): ctitle = titles[0] #添加中文名 data.append(ctitle) otitle = titles[1].replace("/", "") #replace("/", "")去掉無關的符號 data.append(otitle) #添加英文名 else: data.append(titles[0]) data.append(' ')#外國名字留空 rating = re.findall(findReating, item)[0] #添加評分 data.append(rating) judgeNum = re.findall(findJudge,item) #評價人數 data.append(judgeNum) inq = re.findall(findInq, item) #添加概述 if len(inq) != 0: inq = inq[0].replace(".", "") #去掉句號 data.append(inq) else: data.append(" ") #留空 bd = re.findall(findBb,item)[0] bd = re.sub('<br(s+)?/>(s+)?',' ', bd) #去掉br 后面這個bd表示對bd進行操作 bd = re.sub('/', ' ', bd) #替換/ data.append(bd.strip()) #去掉前后的空格strip() datalist.append(data) #把處理好的一部電影放入datalist當中 return datalist

第三部分:得到一個指定的url信息。3SL少兒編程網-https://www.pxcodes.com

#得到指定的一個url網頁信息def askURL(url): head = { "User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Mobile Safari/537.36"} request = urllib.request.Request(url,headers=head) # get請求不需要其他的的,而post請求需要 一個method方法 html = "" try: response = urllib.request.urlopen(request) html = response.read().decode('utf-8') # print(html) except Exception as e: if hasattr(e,'code'): print(e.code) if hasattr(e,'reason'): print(e.reason) return html

第四部分:保存數據3SL少兒編程網-https://www.pxcodes.com

# 3:保存數據def saveData(datalist,savepath): book = xlwt.Workbook(encoding="utf-8", style_compression=0) sheet = book.add_sheet('豆瓣電影Top250', cell_overwrite_ok=True) col = ('電影詳情鏈接', '圖片鏈接', '影片中文名', '影片外國名', '評分', '評價數', '概況', '相關信息') for i in range(0,8): sheet.write(0,i,col[i]) #列名 for i in range(0,250): print("第%d條"%i) data = datalist[i] for j in range(0,8): sheet.write(i+1,j,data[j]) book.save(savepath) #保存

這里大家看一下代碼,關于代碼的標注我寫的還是挺清楚的。3SL少兒編程網-https://www.pxcodes.com

其中關于學習這個爬蟲,還需要學習一些基本的正則表達式,當然python基本的語法是不可少的希望對大家有幫助吧。3SL少兒編程網-https://www.pxcodes.com

相關免費學習推薦:python教程(視頻)

以上就是介紹python爬取網頁的詳細內容,更多請關注少兒編程網其它相關文章!3SL少兒編程網-https://www.pxcodes.com

預約試聽課

已有385人預約都是免費的,你也試試吧...

国产乱子伦高清露脸对白-国产精品欧美久久久久天天影视-国产91视频一区-亚洲欧美日产综合在线网-黄视频网站在线看-国产欧美亚洲精品第1页-亚洲www在线-大学生女人三级在线播放-日本在线视频www鲁啊鲁-国产成人精品一区二区仙踪林-69精品欧美一区二区三区-成人欧美亚洲-日本污污网站-中国妞xxxhd露脸偷拍视频-国产精品aⅴ在线观看-精品中文字幕在线

        五月天中文字幕在线| 国产情侣av自拍| 成人在线观看你懂的| 国产精品入口免费软件| 欧美性猛交xxxx乱大交91| 午夜激情影院在线观看| 国产精品wwwww| 黄色一级视频片| japanese在线视频| 欧美aaa在线观看| 26uuu成人| 日韩在线综合网| 成人免费视频久久| 天天爽天天爽夜夜爽| 午夜免费视频网站| 六月婷婷在线视频| 国产日韩欧美大片| 成人免费在线观看视频网站| 91成人在线观看喷潮教学| 成人黄色一级大片| 三级黄色片免费观看| 香蕉视频禁止18| 在线一区二区不卡| 99精品视频国产| 欧美在线观看黄| 男女裸体影院高潮| 草草久久久无码国产专区| 黄色一级大片免费| 日韩在线综合网| 日韩欧美精品在线观看视频| 日本www高清视频| 在线观看免费的av| 日本福利视频一区| 99re在线视频免费观看| 天天爽夜夜爽一区二区三区| 欧美日韩亚洲一二三| 992kp免费看片| 无码中文字幕色专区| 亚洲精品高清无码视频| 毛片毛片毛片毛片毛| 91成人在线观看喷潮教学| 欧美成人黑人猛交| 日本a级片在线观看| 国产第一页视频| 超级碰在线观看| 亚洲狼人综合干| 黄色一级视频播放| 无限资源日本好片| 亚洲理论电影在线观看| 欧美日韩一区二区三区69堂| 免费网站在线观看视频 | 免费av不卡在线| 久久久久免费精品| 国产成人a亚洲精v品无码| 亚洲成人动漫在线| 激情六月天婷婷| 国产a级片免费看| 精品少妇人妻av一区二区| 欧美日韩中文不卡| 久久撸在线视频| 国产成人黄色网址| 免费网站在线观看黄| 黄色a级片免费| 国产超碰在线播放| 日本三级黄色网址| 中文字幕12页| 777久久精品一区二区三区无码| 国产91av视频在线观看| 青少年xxxxx性开放hg| 欧美高清中文字幕| 九九热在线免费| 国产精品啪啪啪视频| 黄色一级片播放| 男女爽爽爽视频| www.成年人视频| 国产主播在线看| 免费在线观看污污视频| 国产偷人视频免费| 久久av秘一区二区三区| 国产福利视频在线播放| 日日噜噜噜夜夜爽爽| 无码中文字幕色专区| 午夜啪啪免费视频| 午夜激情av在线| 91专区在线观看| 佐佐木明希av| 日本中文字幕在线不卡| 成年人视频网站免费观看| 久久www视频| 经典三级在线视频| av免费一区二区| 国产一区视频免费观看| 国产美女主播在线播放| 男女激情免费视频| 国产精品夜夜夜爽张柏芝| 中文久久久久久| 丁香婷婷激情网| 国产一级做a爰片久久| 免费成人午夜视频| 苍井空浴缸大战猛男120分钟| 日韩亚洲欧美视频| 国产成人黄色片| 一道本视频在线观看| 日日噜噜噜噜久久久精品毛片| 四季av一区二区| 亚洲欧美自拍另类日韩| 国产女人18毛片| 无码播放一区二区三区| 欧美性猛交久久久乱大交小说| 日韩av在线中文| 国产av熟女一区二区三区| a√天堂在线观看| 免费一区二区三区在线观看| 丰满女人性猛交| 激情五月开心婷婷| 法国空姐在线观看免费| 日韩黄色片视频| 亚洲爆乳无码精品aaa片蜜桃| 国产精品亚洲a| 91网址在线观看精品| 狠狠热免费视频| 中文字幕av专区| 欧美一级片免费播放| 午夜视频在线网站| 丝袜老师办公室里做好紧好爽 | 男人添女荫道口女人有什么感觉| 美女黄色免费看| 任你操这里只有精品| 免费无码国产v片在线观看| 日本黄大片在线观看| 国产午夜大地久久| 国产freexxxx性播放麻豆| 国产xxxxx在线观看| 九九九久久久久久久| 思思久久精品视频| 天天干天天干天天干天天干天天干| 国内自拍视频一区| jizzzz日本| 日本a在线免费观看| 和岳每晚弄的高潮嗷嗷叫视频| 国产精品50p| 久久av综合网| 国产又大又硬又粗| 中国女人做爰视频| 欧美aaa在线观看| 毛片在线视频播放| 2019日韩中文字幕mv| 手机在线免费观看毛片| 超碰在线97免费| 久久久久免费精品| 色婷婷777777仙踪林| www.日本一区| a在线观看免费视频| 8x8x最新地址| 成人黄色一区二区| 中文字幕第38页| 日韩精品aaa| 欧美日韩黄色一级片| 日韩小视频在线播放| 亚洲色图久久久| 日日摸日日碰夜夜爽av| 婷婷中文字幕在线观看| 日本不卡一区在线| 天天干天天av| 97久久国产亚洲精品超碰热| 浓精h攵女乱爱av| 国产 欧美 日韩 一区| 一级片免费在线观看视频| 99色这里只有精品| 国产一二三在线视频| 国产欧美精品aaaaaa片| 91免费视频网站在线观看| 涩涩网站在线看| 欧美网站免费观看| 天天操天天爱天天爽| 国产传媒久久久| 特级毛片在线免费观看| 成人性做爰aaa片免费看不忠| 欧美一级在线看| 无码日本精品xxxxxxxxx| 日韩一级理论片| 日韩手机在线观看视频| youjizz.com在线观看| 国产盗摄视频在线观看| 天堂网在线免费观看| 91插插插插插插插插| 亚洲天堂2018av| 人人妻人人澡人人爽精品欧美一区| 欧美黄网在线观看| www.浪潮av.com| 国产一区二区在线免费播放| 国产一级片黄色| 色戒在线免费观看| 国产日韩欧美久久| 免费一区二区三区在线观看| 最新av免费在线观看| 韩日视频在线观看| 噼里啪啦国语在线观看免费版高清版| 激情婷婷综合网| 轻点好疼好大好爽视频|