Python BeautifulSoup 库的使用技巧-icode9专业技术文章分享

互联网 2023/4/1 14:57:38

以下是 Python BeautifulSoup 库的使用技巧[1]:创建 BeautifulSoup 对象from bs4 import BeautifulSouphtml = "<p>test</p>"soup = BeautifulSoup(html, lxml)print(soup.prettify())Tag 选择器:用于根据 HTML 标签和属性值选择元素。from bs4 i…
以下是 Python BeautifulSoup 库的使用技巧[1]:

创建 BeautifulSoup 对象
from bs4 import BeautifulSoup

html = "<p>test</p>"
soup = BeautifulSoup(html, 'lxml')
print(soup.prettify())
Tag 选择器:用于根据 HTML 标签和属性值选择元素。
from bs4 import BeautifulSoup

html = '''
<div id="container">
    <ul class="list">
         <li class="item"><a href="1.html">第1页</a></li>
         <li class="item"><a href="2.html">第2页</a></li>
         <li class="item"><a href="3.html">第3页</a></li>
         <li class="item"><a href="4.html">第4页</a></li>
         <li class="item"><a href="5.html">第5页</a></li>
     </ul>
 </div>
'''

soup = BeautifulSoup(html, 'lxml')

# 选择所有 li 标签
lis = soup.find_all('li')
print(lis)

# 选择所有 class 为 item 的 li 标签
lis = soup.find_all('li', attrs={'class': 'item'})
print(lis)

# 选择第二个 li 标签
li = soup.find_all('li')[1]
print(li)

# 获取标签属性值
link = soup.find_all('a')[0]
print(link.get('href'))
CSS 选择器:使用类似 CSS 选择器的语法来选择元素。
from bs4 import BeautifulSoup

html = '''
<div id="container">
    <ul class="list">
         <li class="item-0"><a href="link1.html">first item</a></li>
         <li class="item-1"><a href="link2.html">second item</a></li>
         <li class="item-2"><a href="link3.html">third item</a></li>
         <li class="item-3"><a href="link4.html">fourth item</a></li>
         <li class="item-4"><a href="link5.html">fifth item</a>
     </ul>
 </div>
'''

soup = BeautifulSoup(html, 'lxml')

# 选择所有 class 为 item-0 的 li 标签
lis = soup.select('li.item-0')
print(lis)

# 获取文本内容
for li in soup.select('li'):
    print(li.get_text())

# 获取标签属性值
link = soup.select('a')[0]
print(link['href'])
以上技巧可以帮助你更好地使用 BeautifulSoup 库,实现你所需要的功能。

标签: 来源:

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

随时随地学软件编程-关注百度小程序和微信小程序
关于找一找教程网

本站文章仅代表作者观点,不代表本站立场,所有文章非营利性免费分享。
本站提供了软件编程、网站开发技术、服务器运维、人工智能等等IT技术文章,希望广大程序员努力学习,让我们用科技改变世界。
[Python BeautifulSoup 库的使用技巧-icode9专业技术文章分享]http://www.zyiz.net/tech/detail-400166.html

赞(0)
关注微信小程序
程序员编程王-随时随地学编程

扫描二维码或查找【程序员编程王】

可以随时随地学编程啦!

技术文章导航 更多>