Python BeautifulSoup 库的使用技巧-icode9专业技术文章分享
互联网 2023/4/1 14:57:38
创建 BeautifulSoup 对象
from bs4 import BeautifulSoup
html = "<p>test</p>"
soup = BeautifulSoup(html, 'lxml')
print(soup.prettify())
Tag 选择器:用于根据 HTML 标签和属性值选择元素。
from bs4 import BeautifulSoup
html = '''
<div id="container">
<ul class="list">
<li class="item"><a href="1.html">第1页</a></li>
<li class="item"><a href="2.html">第2页</a></li>
<li class="item"><a href="3.html">第3页</a></li>
<li class="item"><a href="4.html">第4页</a></li>
<li class="item"><a href="5.html">第5页</a></li>
</ul>
</div>
'''
soup = BeautifulSoup(html, 'lxml')
# 选择所有 li 标签
lis = soup.find_all('li')
print(lis)
# 选择所有 class 为 item 的 li 标签
lis = soup.find_all('li', attrs={'class': 'item'})
print(lis)
# 选择第二个 li 标签
li = soup.find_all('li')[1]
print(li)
# 获取标签属性值
link = soup.find_all('a')[0]
print(link.get('href'))
CSS 选择器:使用类似 CSS 选择器的语法来选择元素。
from bs4 import BeautifulSoup
html = '''
<div id="container">
<ul class="list">
<li class="item-0"><a href="link1.html">first item</a></li>
<li class="item-1"><a href="link2.html">second item</a></li>
<li class="item-2"><a href="link3.html">third item</a></li>
<li class="item-3"><a href="link4.html">fourth item</a></li>
<li class="item-4"><a href="link5.html">fifth item</a>
</ul>
</div>
'''
soup = BeautifulSoup(html, 'lxml')
# 选择所有 class 为 item-0 的 li 标签
lis = soup.select('li.item-0')
print(lis)
# 获取文本内容
for li in soup.select('li'):
print(li.get_text())
# 获取标签属性值
link = soup.select('a')[0]
print(link['href'])
以上技巧可以帮助你更好地使用 BeautifulSoup 库,实现你所需要的功能。
标签: 来源:
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

关于找一找教程网
本站文章仅代表作者观点,不代表本站立场,所有文章非营利性免费分享。
本站提供了软件编程、网站开发技术、服务器运维、人工智能等等IT技术文章,希望广大程序员努力学习,让我们用科技改变世界。
[Python BeautifulSoup 库的使用技巧-icode9专业技术文章分享]http://www.zyiz.net/tech/detail-400166.html
- 2023-06-01Python全景系列-9 Python 装饰器:优雅地增强你的函数和类
- 2023-05-31Python文件指针大揭秘,轻松驰骋文件操作!
- 2023-05-31Python全景系列-6 掌握Python面向对象编程的关键:深度探索类与对象
- 2023-05-31Python自动化办公对每个子文件夹的Excel表加个表头(Excel不同名且有xls文件)
- 2023-05-31盘点一个VScode中Python解释器选择的问题
- 2023-05-31Python全景系列-7 提升Python编程效率:模块与包全面解读
- 2023-05-31520新的开始--python学习之路(慕课网python全能工程师)
- 2023-05-10平平无奇的Python为什么能一跃成为世界排名第一的语言
- 2023-05-10Python面试题库
- 2023-05-03关于python编程的一些技巧和有效工具-icode9专业技术文章分享