Python爬虫初学-urllib3

日期：2024-01-17 浏览：268 评论：0

学习爬虫中，从最近自己写的爬虫小程序中抓截一点代码。加深下记忆。

1.因为我已经安装了Python3,所以使用了urllib3库。

2.要根据对应网页的数据格式进行解码，有的是utf-8，有的是GB2312，当然可能还有其它。否则会报错。

import urllib3 import time
#因为我使用了Python3，所以使用urllib3库 http = urllib3.PoolManager() response=http.request('GET','https://www.cnblogs.com/') http_data = response.data.decode('utf-8') #GB2312
#在抓取的网页数据中查找匹配的数据 User = "齐妙非凡" if (http_data.find(User,0,len(http_data)) != -1): print("找到【%s】的随笔!"%User) else: print("找不到【%s】的随笔!"%User)
#建立文件，保存每次抓取到的网页的内容 data_filename=r'LOG\%s_data.log'%(time.strftime('%Y%m%d%H%M%S')) web_data = open(data_filename,'w',encoding='utf-8') web_data.write(http_data) web_data.close()

打赏

本文转载自：网络

所有权利归属于原作者，如文章来源标示错误或侵犯了您的权利请联系微信13520258486

更多>最近资讯中心

更多>最新资讯中心

0 条相关评论

推荐图文

推荐资讯中心

点击排行

最新信息

新手指南: 注册新用户

操作指南

常见问题

采购商服务: 找产品

找公司

找采购

看资讯

供应商服务: 企业商铺

VIP服务

认证服务

推广服务

交易安全: 买家防骗

卖家防骗

投诉举报

关注我们: 手机网站:

新浪微博:

微信关注:

13520258486

周一至周五 9:00-18:00
（其他时间联系在线客服）

24小时在线客服

• faker生成器生成虚拟数据的Python模块	• 一文搞定Python正则表达式
• Python 实现邮件发送功能（进阶）	• Python3 装饰器解析
• Python趣味脚本，做一个简单的抽奖刮刮卡	• Python爬虫之urllib模拟登录及cookie的那点事

• Python快速去水印，提高工作效率，一步到位（附	• Python生成器generator简介
• python抓取动态验证码,具体第几帧数的位置静态	• os模块
• faker生成器生成虚拟数据的Python模块	• 一文搞定Python正则表达式
• Python 实现邮件发送功能（进阶）	• Python3 装饰器解析
• Python趣味脚本，做一个简单的抽奖刮刮卡	• Python爬虫之urllib模拟登录及cookie的那点事