Requests 是唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。
警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。
Requests 允许你发送纯天然,植物饲养的 HTTP/1.1 请求,无需手工劳动。HTTP请求
requests模块针对不同的HTTP请求提供的相应的顶层方法,
包括:get, post, put, delete, head及options等
>>> r = requests.get("http://httpbin.org/get")
>>> r = requests.post("http://httpbin.org/post")
>>> r = requests.put("http://httpbin.org/put")
>>> r = requests.delete("http://httpbin.org/delete")
>>> r = requests.head("http://httpbin.org/get")
>>> r = requests.options("http://httpbin.org/get")这就是官方文档中所描述的纯天然、无需手工劳动的HTTP请求,
然后在这个基础上可以根据不同的需求添加不同的关键字参数。
传递URL参数 - params
关键字参数params用于传递URL参数,以一个字典对象来提供键值对参数
>>> payload = {'key1': 'value1', 'key2': ['value2', 'value3'], 'key3': None}
>>> r = requests.get('http://httpbin.org/get', params=payload)
>>> print(r.url)
#http://httpbin.org/get?key1=value1&key2=value2&key2=value3这里注意两点:
- 字典里值为
None的键不会被添加到URL中 - 字典里值为数组的键会被拆分成多个同时添加到URL中,如上例中的key2
Post数据 - data, json, files
一般在发起POST请求的时候会附加上一些要传送给服务器的数据,如表单,文件等。
- 对于表单形式的数据,只要简单的将一个字典传递给
data参数
>>> payload = {'key1': 'value1', 'key2': 'value2'}
>>> r = requests.post("http://httpbin.org/post", data=payload)
# 通过抓包可以发现发起的HTTP请求中BODY部分就是已经编码的表单数据
# key1=value1&key2=value2注:
data参数也可以接受一个字符串参数直接发布出去。
- 有些服务接受JSON编码格式的数据,可以使用
json参数
>>> r = requests.post("http://httpbin.org/post", json=payload)
# 这是发送出去的HTTP请求中BODY部分就是JSON格式的字符串
# {"key1": "value1", "key2": "value2"}- 若是要上传文件数据,可以使用
files参数
>>> files = {'file': open('report.xls', 'rb')}
>>> r = requests.post("http://httpbin.org/post", files=files)自定义请求头 - headers
通过headers参数提供的字典值自定义添加HTTP请求头信息,
如服务要求JSON数据格式,要求请求Content-Type为application/json
headers = {'Content-Type':'application/json'}
r = requests.post(url, headers=headers, data=jsonstring)注: 其实这个例子里的问题可以使用
json参数来解决, 在使用json参数时会自动在请求头中添加Content-Type: application/json信息
>>> requests.post(url, json=jsonstring)Cookies - cookies
要想要在发送请求时发送Cookies数据,可以使用cookies参数,
可以使用requests.cookies.RequestCookieJar来构建Cookies
>>> jar = requests.cookies.RequestsCookieJar()
>>> jar.set('tasty_cookie', 'yum', site='httpbin.org', path='/cookies')
>>> jar.set('gross_cookie', 'blech', site='httpbin.org', path='/elsewhere')
>>> r = requests.get('http://httpbin.org/cookies', cookies=jar)超时时间 - timeout
在请求时指定超时时间,若超过超时时间服务器没有响应,
则会抛出requests.exceptions.Timeout错误
HTTP响应
请求方法返回的Response对象,可以通过响应码来确定响应状态,
并获取不同格式的响应内容(以下默认r为Response类型对象)
r.status_code属性可以用来获取响应码,如:200,万恶的404等- 响应内容可以获取文本、二进制、JSON等格式:
r.text返回unicode格式的字符串响应内容, 其内容编码可以通过r.encoding属性来设置r.content返回二进制格式的响应内容r.json把响应内容当做JSON字符串来处理,解码后返回JSON对象
r.cookes可以获取响应中要设置的cookies
参考链接: http://docs.python-requests.org/en/master/user/quickstart/