最简单的爬虫,又简化了,从4行变3行,你值得拥有!
运行环境:
- Python3.10 及以上
- 最新 Google 浏览器
安装依赖库
pip install DrissionPage
示例代码:
from DrissionPage import ChromiumPage
page = ChromiumPage()
# 打开百度官网
page.get('https://www.baidu.com')
执行成功后,会自动打开谷歌浏览器。并且访问百度官网。
只需3步,即可打开一个浏览器。比我之前的文章更加好,这可以动态爬取你想要的内容。
它获取定位元素,那是更加简单,只需要调用一行函数。
# 定位到账号文本框,获取文本框元素
ele = page.ele('#user_login')
快去试试吧!
更多信息
WebPage是功能最全面的页面类,既可控制浏览器,也可收发数据包:
from DrissionPage import WebPage
如果只要控制浏览器,导入ChromiumPage:
from DrissionPage import ChromiumPage
如果只要收发数据包,导入SessionPage:
from DrissionPage import SessionPage
如果你想要更多:参考 收发数据包 - DrissionPage