Python爬虫:Ptyhon中RE模块的使用
Ptyhon中RE模块的使用1. 正则表达式参考:廖雪峰的官方网站2. Python Re模块Python提供re模块,包含所有正则表达式的功能。由于Python的字符串本身也用转义,因此我们强烈建议使用Python的r前缀,就不用考虑转义的问题了2.1 re.match(pattern, string[, flags])如果字符串开头的零个或多个字符与正则表达式模式...
Python爬虫:Urllib库的基本使用
1.抓取一个网页抓取网页就是根据URL来获取它的网页信息:# -*- coding:utf-8 -*-
import urllib
# urllib.request 请求模块
response = urllib.request.urlopen("http://www.baidu.com")
print(response.read())在vscode中按F5执行后结果如图...