Python 爬虫教程 03
1.无请求头访问
如果不构建请求头,直接向目标网站发送请求:
1 | import requests |
输出结果:
1 | <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> |
很容易被网站检测到是爬虫。
2.添加请求头
所以基本上在发送请求之前都会封装一个http
请求的头部信息:
1 | headers = { |
有时候还需要往里面填入Cookie
。甚至为了防止被检测到是爬虫,需要更换User-Agent
,比如用火狐浏览器的等,或者浏览器不同版本的,这在网上可以查询到。
- Title: Python 爬虫教程 03
- Author: loskyertt
- Created at : 2024-10-17 16:51:40
- Updated at : 2024-11-13 03:07:38
- Link: https://redefine.ohevan.com/2024/10/17/03Python爬虫/
- License: This work is licensed under CC BY-NC-SA 4.0.
Comments