编写第一个简单的爬虫
第一步:获取页面
import requests #导入requests包
link = "http://www.santostang.com/" #定义link 为目标网页地址
headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:87.0) Gecko/20100101 Firefox/87.0'}
#定义请求头的浏览器,伪装成浏览器
r = requests.get(link, headers= headers) #请求网页
print(r.text) #t.text 是获取网页内容代码
第二步:提取需要的数据


第三步:存储数据


Last updated