pip install beautifulsoup4

Requirement already satisfied: beautifulsoup4 in /opt/conda/lib/python3.12/site-packages (4.13.3)
Requirement already satisfied: soupsieve>1.2 in /opt/conda/lib/python3.12/site-packages (from beautifulsoup4) (2.5)
Requirement already satisfied: typing-extensions>=4.0.0 in /opt/conda/lib/python3.12/site-packages (from beautifulsoup4) (4.12.2)
Note: you may need to restart the kernel to use updated packages.

import requests
from bs4 import BeautifulSoup
url='http://www.igadc.cn/'
headers = {
            'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'
          }
html = requests.get(url, headers=headers, timeout=10000)
demo = html.text

soup = BeautifulSoup(demo,"html.parser")
soup.head

<head>
<meta charset="utf-8"/>
<meta content="www.igadc.cn" name="generator"/>
<meta content="pc,mobile" name="applicable-device"/>
<meta content="www.igadc.cn" name="author"/>
<meta content="www.igadc.cn" name="Copyright"/>
<meta content="width=device-width, initial-scale=1.0" name="viewport"/>
<link href="/static/favicon.ico" mce_href="/static/favicon.ico" rel="icon" type="image/x-icon"/>
<link href="/static/favicon.ico" mce_href="/static/favicon.ico" rel="shortcut icon" type="image/x-icon"/>
<script src="/static/f2elib/jquery/jquery-3.3.1.min.js?v=f8da8f95b6ed33542a88af19028e18ae3d9ce25350a06bfc3fbf433ed2b38fefa5e639cddfdac703fc6caa7f3313d974b92a3168276b3a016ceb28f27db0714a"></script>
<script src="/static/f2elib/bootstrap_3.3.7/js/bootstrap.min.js?v=8b3b64a1bb2f9e329f02d4cd7479065630184ebaed942ee61a9ff9e1ce34c28c0eecb854458977815cf3704a8697fa8a5d096d2761f032b74b70d51da3e37f45"></script>
<script src="/static/f2elib/jquery-validate_1.15.0/jquery.validate.min.js?v=0da5e2cd6eeb9de26233f5ce9d341543bc0364154d5dfe54f6b13cf013d8850704438a63684665097e61818dfee02dcaf758df7695166f3f2df262ff8350434f"></script>
<script src="/static/f2elib/magnific-popup_1.1.0/jquery.magnific-popup.min.js?v=22c361e44dde632dedaff2625f6631e2fb02ba3b6487097b48baa09f02cd81fd381ebb7d053f525e52e56655b1f8e2b89ddcc0a002e1b0c35c0a6920823641d7"></script>
<script src="/static/f2elib/leaflet_1.3.1/leaflet.js?v=b6280d0b767f2747258718b2ffb31b5ee1091b6a7e49aec9b8abff25ad6d232b9fee4e360f5802688ed43a446cc6a80f0fef45b23ed3af793fe1d8a817a12c15"></script>
<script src="/static/f2elib/leaflet/leaflet.ChineseTmsProviders.js?v=24f734210bd9277f01e24be313d4d087fd4c5831489bca8fe96e6e70a6b5169969f7d2273cfc3c317bc3660dfde5ee85847d091b39ea0a952f621e4b528eb09b"></script>
<link href="/static/f2elib/bootstrap_3.3.7/css/bootstrap.min.css?v=e8c5daf01eae68ed7c1e277a6e544c7ad108a0fa877fb531d6d9f2210769b7da88e4e002c7b0be3b72154ebf7cbf01a795c8342ce2dad368bd6351e956195f8b" rel="stylesheet"/>
<link href="/static/f2elib/leaflet_1.3.1/leaflet.css?v=464b26e517a70442922858e02376b8d6fae3930e0454f949dfe3a223ae6f4e321da3d6eb94069c12e28e890e4e161edc388d5b903c0ba9d2f0dd983471124001" rel="stylesheet"/>
<script src="/static/f2elib/codemirror_5.25.0/lib/codemirror.js?v=3fedfaf4a6d6eb6befdc2a12da3d8c1b1f1ed48b461bbcd679e38251cb5e7f43e1dd117b752e83ccd6868805fcbb95c62d75cc7d3487fd980010174aef6ec996"></script>
<script src="/static/f2elib/codemirror_5.25.0/addon/edit/continuelist.js?v=2a1989cdc974ed376b701488182bc3b3ab49a6b87d300b051e7198fdebebe52f80eedb1d6428c7a97e1aa24a4fd0c86221f9ba6cbe3881d4e64643080d18cf22"></script>
<script src="/static/f2elib/codemirror_5.25.0/mode/markdown/markdown.js?v=762a1979a2cca8b868398f3671a4a466a08a68c6f9c690f40a8f814893a33a727a997415daefd2bed712ff7acd5b5b8c14e2a7f61b267c4e5fcf16b1750517db"></script>
<link href="/static/f2elib/codemirror_5.25.0/lib/codemirror.css?v=76e8d7d110f1a96f56511993745fb61ae1f59018f5c25bb0b8a65cd82362126ac5a1d13b2a07e95f18b5c536d9fc50b4adef9b284340229a30d6647d7732c934" rel="stylesheet"/>
<link href="/static/tass/css/style.css?v=aa9ec3b99a531d9a2bdf519dfc27ae63dfc5c37eb268a47d17d0090801763c76436092353271900fc475fdfc6d96ba53f7e05900ec44b5e0c3f57d4abc31a10f" rel="stylesheet" type="text/css"/>
<link href="/static/css/dropdown.css?v=d8e3d047fc6695a8b41765eda5c5bc471a196d10e3c25b45d0e8aaca1c6822ceb8cffedce508abdb79b4c7c1b658536d29bb528961f9a26fdc7e4a21af02baf5" rel="stylesheet" type="text/css"/>
<title>东北亚资源环境大数据中心</title>
<meta content="东北亚资源环境大数据中心" name="keywords"/>
<meta content="东北亚资源环境大数据中心" name="description"/>
<script type="text/javascript">
$().ready(function () {
$("#find_calc").validate(
{
rules: {
keyword: {
required: true
}
},
messages: {
keyword: {
required: "<span class='red'>Please enter the key words to query</span>"
}
}
}
);
});
</script>
<style type="text/css">
#map_div {
width: 100%;
height: 420px;
border: 1px solid black;
text-align: center;
align-self: center;
z-index: 1;
}
</style>
<link href="/static/css/nav-hidden.css" rel="stylesheet"/>
<script>
var _hmt = _hmt || [];
(function() {
var hm = document.createElement("script");
hm.src = "https://hm.baidu.com/hm.js?fc17a7c3f593f2612726ce8d229021f6";
var s = document.getElementsByTagName("script")[0];
s.parentNode.insertBefore(hm, s);
})();
</script>
</head>

soup.head.contents[:10]

['\n',
 <meta charset="utf-8"/>,
 '\n',
 <meta content="www.igadc.cn" name="generator"/>,
 '\n',
 <meta content="pc,mobile" name="applicable-device"/>,
 '\n',
 <meta content="www.igadc.cn" name="author"/>,
 '\n',
 <meta content="www.igadc.cn" name="Copyright"/>]

soup.img

<img alt="logo" class="img-thumbnail" src="/static/imgs/igais_logo.jpg?v=fd4a7b670b0072bebe888a6010c83f1f4955080f30513d6656b129f9b77742e182daca917276069b14fc3745a2ba8489d908277c4ad92be71382fdbca090afab"/>

soup.title

<title>东北亚资源环境大数据中心</title>

soup.body.b

<b class="caret"></b>

soup.find_all('a')[:5]

[<a class="navbar-brand" href="/">IGADC</a>,
 <a href="/special/list?tag=agroecology" title="数据目录">数据目录</a>,
 <a href="/sci-lab/index.html" title="科学计算">科学计算</a>,
 <a href="/post/" title="文档">文档</a>,
 <a href="/science/index.html" title="教育科普">教育科普</a>]

soup.head.contents[:5]

['\n',
 <meta charset="utf-8"/>,
 '\n',
 <meta content="www.igadc.cn" name="generator"/>,
 '\n']

soup_1 = BeautifulSoup("""<div>
    <p><span><b>test</b></span></p>
</div>
""")
soup_1.p.string

'test'

soup.find_all('b')

[<b class="caret"></b>, <b>电子邮件</b>]

import re
for tag in soup.find_all(re.compile("^b")):
    print(tag.name)

body
button
b
br
br
br
b

soup.find_all(["title", "b"])

[<title>东北亚资源环境大数据中心</title>, <b class="caret"></b>, <b>电子邮件</b>]

for tag in soup.find_all(True)[:5]:
    print(tag.name)

html
head
meta
meta
meta

soup.find_all("link")

[<link href="/static/favicon.ico" mce_href="/static/favicon.ico" rel="icon" type="image/x-icon"/>,
 <link href="/static/favicon.ico" mce_href="/static/favicon.ico" rel="shortcut icon" type="image/x-icon"/>,
 <link href="/static/f2elib/bootstrap_3.3.7/css/bootstrap.min.css?v=e8c5daf01eae68ed7c1e277a6e544c7ad108a0fa877fb531d6d9f2210769b7da88e4e002c7b0be3b72154ebf7cbf01a795c8342ce2dad368bd6351e956195f8b" rel="stylesheet"/>,
 <link href="/static/f2elib/leaflet_1.3.1/leaflet.css?v=464b26e517a70442922858e02376b8d6fae3930e0454f949dfe3a223ae6f4e321da3d6eb94069c12e28e890e4e161edc388d5b903c0ba9d2f0dd983471124001" rel="stylesheet"/>,
 <link href="/static/f2elib/codemirror_5.25.0/lib/codemirror.css?v=76e8d7d110f1a96f56511993745fb61ae1f59018f5c25bb0b8a65cd82362126ac5a1d13b2a07e95f18b5c536d9fc50b4adef9b284340229a30d6647d7732c934" rel="stylesheet"/>,
 <link href="/static/tass/css/style.css?v=aa9ec3b99a531d9a2bdf519dfc27ae63dfc5c37eb268a47d17d0090801763c76436092353271900fc475fdfc6d96ba53f7e05900ec44b5e0c3f57d4abc31a10f" rel="stylesheet" type="text/css"/>,
 <link href="/static/css/dropdown.css?v=d8e3d047fc6695a8b41765eda5c5bc471a196d10e3c25b45d0e8aaca1c6822ceb8cffedce508abdb79b4c7c1b658536d29bb528961f9a26fdc7e4a21af02baf5" rel="stylesheet" type="text/css"/>,
 <link href="/static/css/nav-hidden.css" rel="stylesheet"/>]

soup.find_all("title")

[<title>东北亚资源环境大数据中心</title>]

soup.find_all(href=re.compile("//www.osgeo.cn"))[:5]

[<a href="http://www.osgeo.cn/" target="_blank" title="OSGeo中国中心">OSGeo中国中心</a>]

soup.find_all( class_="badge")[:5]

[<span class="badge" style="float: right">
 2020-12-19
 </span>,
 <span class="badge" style="float: right">
 2020-12-19
 </span>,
 <span class="badge" style="float: right">
 2020-12-19
 </span>,
 <span class="badge" style="float: right">
 2020-12-19
 </span>,
 <span class="badge" style="float: right">
 2020-12-19
 </span>]

soup.find_all(string="地图")

['地图']

soup.find_all(string=re.compile("黑龙江"))

['\n\n黑龙江省地貌矢量数据\n\n',
 '\n黑龙江省多年平均气温数据\n',
 '\n黑龙江省多年平均相对湿度数据\n',
 '\n黑龙江省1：50万盐碱地分布数据集（2000年）\n',
 '\n黑龙江省1：100万植被分布数据集（2000年）\n',
 ' \n<script>\nfunction uv(result) {\n$.each(result, function (i, field) {\n//alert(i);\nif (i == \'code\') {\n// window.location.href = \'/page/\' + field;\n}\nelse if (i == "uid") {\n$("#wiki_edit_link").html(\'<a href="/page/_edit/\' + field + \'">Edit</a>\');\n}\nelse if (i == "title") {\n$("#wiki_title").html(field);\n}\nelse if (i == \'time_update\') {\nvar date = new Date(field * 1000);\n$("#wiki_time_update").html(date.getFullYear() + \'-\' + date.getMonth() + \'-\' + date.getDay());\n}\nelse {\n$("#wiki_cnt_html" ).html(field);\n}\n});\n}\nfunction load_post(post_id) {\n$.getJSON("/post_j/" + post_id, function (result) {\nuv(result);\n})\n}\n</script>\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2023-07-05</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/1158d" title="海伦示范区“东生”大豆入选黑龙江省主推品种">\n海伦示范区“东生”大豆入选黑龙江省主推品种\n</a>\n</li>\n\n\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2022-11-18</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/1f7b0" title="辽宁省1990生态系统空间分布数据">\n辽宁省1990生态系统空间分布数据\n</a>\n</li>\n\n\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2022-09-08</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/14fed" title="东北亚地理中心-吉林省">\n东北亚地理中心-吉林省\n</a>\n</li>\n\n\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2022-07-26</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/1476f" title="东北地理所科学数据中心顺利通过验收并被评为优秀">\n东北地理所科学数据中心顺利通过验收并被评为优秀\n</a>\n</li>\n\n\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2022-01-20</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/gi120" title="地学资讯速读——2022年1月20日">\n地学资讯速读——2022年1月20日\n</a>\n</li>\n\n\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2022-01-14</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/gi114" title="地学资讯速读——2022年1月14日">\n地学资讯速读——2022年1月14日\n</a>\n</li>\n\n\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2022-01-07</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/gi107" title="地学资讯速读——2022年1月7日">\n地学资讯速读——2022年1月7日\n</a>\n</li>\n\n\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2021-12-31</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/gic31" title="地学资讯速读——2021年12月31日">\n地学资讯速读——2021年12月31日\n</a>\n</li>\n\n\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2021-12-03</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/1f7de" title="白城市政府领导来所对接“黑土粮仓”科技会战大安示范区工作">\n白城市政府领导来所对接“黑土粮仓”科技会战大安示范区工作\n</a>\n</li>\n\n\n\n\n\n<li class="list-group-item" style="overflow: hidden; text-overflow:ellipsis; white-space: nowrap; display: block; ">\n<span class="date">\n2021-09-24</span>\n\n<span class="glyphicon glyphicon-list-alt"></span>\n\n<a href="/post/gi924" title="地学资讯速读——2021年9月24日">\n地学资讯速读——2021年9月24日\n</a>\n</li>\n\n\n\n']

len(soup.find_all("a"))

125

soup.find_all("a", limit=5)

[<a class="navbar-brand" href="/">IGADC</a>,
 <a href="/special/list?tag=agroecology" title="数据目录">数据目录</a>,
 <a href="/sci-lab/index.html" title="科学计算">科学计算</a>,
 <a href="/post/" title="文档">文档</a>,
 <a href="/science/index.html" title="教育科普">教育科普</a>]

soup.find_all("title")

[<title>东北亚资源环境大数据中心</title>]

soup.html.find_all("title", recursive=False)

[]

print(soup.find("aaaaaaa"))

None

print(soup.find_all("aaaaaaa"))

[]

a_string = soup.find(string="地图")
a_string

'地图'

a_string.find_parents("a")

[<a href="/map/" title="地图">地图</a>]

first_link = soup.a

first2_link = first_link.find_next_siblings(string=True)
first2_link

['\n']

first3_link = first_link.find_next_sibling(string=True)
first3_link

'\n'

first_link.find_all_next(string=True)[:10]

['IGADC',
 '\n',
 '\n',
 '\n',
 '\n',
 ' <li class="dropdown hidden-mid">',
 '\n',
 ' <a href="#" class="dropdown-toggle" data-toggle="dropdown">',
 '\n',
 ' 学科分中心 <b class="caret"></b>']

first_link.find_next("p")

<p align="center" style="margin-top: 20px;color:#878B91;">Copyright © 中国科学院东北地理与农业生态研究所 <a href="https://beian.miit.gov.cn" target="_blank">吉ICP备05002032号</a></p>

soup.head.prettify()

'<head>\n <meta charset="utf-8"/>\n <meta content="www.igadc.cn" name="generator"/>\n <meta content="pc,mobile" name="applicable-device"/>\n <meta content="www.igadc.cn" name="author"/>\n <meta content="www.igadc.cn" name="Copyright"/>\n <meta content="width=device-width, initial-scale=1.0" name="viewport"/>\n <link href="/static/favicon.ico" mce_href="/static/favicon.ico" rel="icon" type="image/x-icon"/>\n <link href="/static/favicon.ico" mce_href="/static/favicon.ico" rel="shortcut icon" type="image/x-icon"/>\n <script src="/static/f2elib/jquery/jquery-3.3.1.min.js?v=f8da8f95b6ed33542a88af19028e18ae3d9ce25350a06bfc3fbf433ed2b38fefa5e639cddfdac703fc6caa7f3313d974b92a3168276b3a016ceb28f27db0714a">\n </script>\n <script src="/static/f2elib/bootstrap_3.3.7/js/bootstrap.min.js?v=8b3b64a1bb2f9e329f02d4cd7479065630184ebaed942ee61a9ff9e1ce34c28c0eecb854458977815cf3704a8697fa8a5d096d2761f032b74b70d51da3e37f45">\n </script>\n <script src="/static/f2elib/jquery-validate_1.15.0/jquery.validate.min.js?v=0da5e2cd6eeb9de26233f5ce9d341543bc0364154d5dfe54f6b13cf013d8850704438a63684665097e61818dfee02dcaf758df7695166f3f2df262ff8350434f">\n </script>\n <script src="/static/f2elib/magnific-popup_1.1.0/jquery.magnific-popup.min.js?v=22c361e44dde632dedaff2625f6631e2fb02ba3b6487097b48baa09f02cd81fd381ebb7d053f525e52e56655b1f8e2b89ddcc0a002e1b0c35c0a6920823641d7">\n </script>\n <script src="/static/f2elib/leaflet_1.3.1/leaflet.js?v=b6280d0b767f2747258718b2ffb31b5ee1091b6a7e49aec9b8abff25ad6d232b9fee4e360f5802688ed43a446cc6a80f0fef45b23ed3af793fe1d8a817a12c15">\n </script>\n <script src="/static/f2elib/leaflet/leaflet.ChineseTmsProviders.js?v=24f734210bd9277f01e24be313d4d087fd4c5831489bca8fe96e6e70a6b5169969f7d2273cfc3c317bc3660dfde5ee85847d091b39ea0a952f621e4b528eb09b">\n </script>\n <link href="/static/f2elib/bootstrap_3.3.7/css/bootstrap.min.css?v=e8c5daf01eae68ed7c1e277a6e544c7ad108a0fa877fb531d6d9f2210769b7da88e4e002c7b0be3b72154ebf7cbf01a795c8342ce2dad368bd6351e956195f8b" rel="stylesheet"/>\n <link href="/static/f2elib/leaflet_1.3.1/leaflet.css?v=464b26e517a70442922858e02376b8d6fae3930e0454f949dfe3a223ae6f4e321da3d6eb94069c12e28e890e4e161edc388d5b903c0ba9d2f0dd983471124001" rel="stylesheet"/>\n <script src="/static/f2elib/codemirror_5.25.0/lib/codemirror.js?v=3fedfaf4a6d6eb6befdc2a12da3d8c1b1f1ed48b461bbcd679e38251cb5e7f43e1dd117b752e83ccd6868805fcbb95c62d75cc7d3487fd980010174aef6ec996">\n </script>\n <script src="/static/f2elib/codemirror_5.25.0/addon/edit/continuelist.js?v=2a1989cdc974ed376b701488182bc3b3ab49a6b87d300b051e7198fdebebe52f80eedb1d6428c7a97e1aa24a4fd0c86221f9ba6cbe3881d4e64643080d18cf22">\n </script>\n <script src="/static/f2elib/codemirror_5.25.0/mode/markdown/markdown.js?v=762a1979a2cca8b868398f3671a4a466a08a68c6f9c690f40a8f814893a33a727a997415daefd2bed712ff7acd5b5b8c14e2a7f61b267c4e5fcf16b1750517db">\n </script>\n <link href="/static/f2elib/codemirror_5.25.0/lib/codemirror.css?v=76e8d7d110f1a96f56511993745fb61ae1f59018f5c25bb0b8a65cd82362126ac5a1d13b2a07e95f18b5c536d9fc50b4adef9b284340229a30d6647d7732c934" rel="stylesheet"/>\n <link href="/static/tass/css/style.css?v=aa9ec3b99a531d9a2bdf519dfc27ae63dfc5c37eb268a47d17d0090801763c76436092353271900fc475fdfc6d96ba53f7e05900ec44b5e0c3f57d4abc31a10f" rel="stylesheet" type="text/css"/>\n <link href="/static/css/dropdown.css?v=d8e3d047fc6695a8b41765eda5c5bc471a196d10e3c25b45d0e8aaca1c6822ceb8cffedce508abdb79b4c7c1b658536d29bb528961f9a26fdc7e4a21af02baf5" rel="stylesheet" type="text/css"/>\n <title>\n  东北亚资源环境大数据中心\n </title>\n <meta content="东北亚资源环境大数据中心" name="keywords"/>\n <meta content="东北亚资源环境大数据中心" name="description"/>\n <script type="text/javascript">\n  $().ready(function () {\n$("#find_calc").validate(\n{\nrules: {\nkeyword: {\nrequired: true\n}\n},\nmessages: {\nkeyword: {\nrequired: "<span class=\'red\'>Please enter the key words to query</span>"\n}\n}\n}\n);\n});\n </script>\n <style type="text/css">\n  #map_div {\nwidth: 100%;\nheight: 420px;\nborder: 1px solid black;\ntext-align: center;\nalign-self: center;\nz-index: 1;\n}\n </style>\n <link href="/static/css/nav-hidden.css" rel="stylesheet"/>\n <script>\n  var _hmt = _hmt || [];\n(function() {\nvar hm = document.createElement("script");\nhm.src = "https://hm.baidu.com/hm.js?fc17a7c3f593f2612726ce8d229021f6";\nvar s = document.getElementsByTagName("script")[0];\ns.parentNode.insertBefore(hm, s);\n})();\n </script>\n</head>\n'

soup.head.title.prettify()

'<title>\n 东北亚资源环境大数据中心\n</title>\n'

soup_3 = BeautifulSoup("&ldquo;Dammit!&rdquo; he said.")
soup_3

<html><body><p>“Dammit!” he said.</p></body></html>

soup.head.get_text()

'\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n东北亚资源环境大数据中心\n\n\n\n\n\n\n'

markup = b"<h1>\xed\xe5\xec\xf9</h1>"
soup_3 = BeautifulSoup(markup)
soup_3.original_encoding

'Big5'

安装

测试

遍历文档树

子节点和获取字符串

查找

`find_all()`

`find()`

`find_parents()` 和 `find_parent()`

`find_next_siblings()` 和`find_next_sibling()`

`find_all_next()` 和 `find_next()`

基于bs4库HTML的格式化输出

① 阅读使用手册

② 注册用户账号

介绍

平台内核

注意事项

安装

测试

遍历文档树

子节点和获取字符串

查找

find_all()

find()

find_parents() 和 find_parent()

find_next_siblings() 和find_next_sibling()

find_all_next() 和 find_next()

基于bs4库HTML的格式化输出

① 阅读使用手册

② 注册用户账号

③ 登陆

Python基础

Python进阶

标准类库

专题工具

图像处理

科学计算

自然语言

开源GIS

R与Julia

介绍

平台内核

注意事项

`find_all()`

`find()`

`find_parents()` 和 `find_parent()`

`find_next_siblings()` 和`find_next_sibling()`

`find_all_next()` 和 `find_next()`