python 中 lxml 的 etree 标签解析

来源：脚本之家时间：2022-04-02 15:54:13

一、安装

pip install lxml

二、创建标签

from lxml import etree

root = etree.Element("root")

三、添加子节点

from lxml import etree

root = etree.Element("root")
span = etree.SubElement(root, "span")

四、删除子节点

from lxml import etree

root = etree.Element("root")

span = etree.SubElement(root, "span")
root.remove(span)

五、删除所有子节点

from lxml import etree

root = etree.Element("root")
root.clear()

六、操作子节点

from lxml import etree

root = etree.Element("root")

span = etree.SubElement(root, "span")

# 获取标签数
len(root)
# 获取标签索引号,如果有多个相同标签的话,可以区分
root.index(span)
# 按位置插入
root.insert(0, etree.Element("p"))
# 尾部添加
root.append(etree.Element("strong"))

七、获取父节点

获取标签父节点的两种方法：

from lxml import etree

root = etree.Element("root")

span = etree.SubElement(root, "span")

# 获取父节点方法一
span.getparent().tag
# 获取父节点方法二,用列表获取子节点,再获取父节点
root[0].getparent().tag

八、创建属性

from lxml import etree

root = etree.Element("root")
root.set("title", "这是一个root标签")

九、获取属性

获取属性的三种方法

from lxml import etree
root = etree.Element("root")
# 获取属性方法一
root.get("title")
# 获取属性方法二,参考字典的操作
root.keys(),root.values(),root.items()
# 获取属性方法三,直接拿到属性存放的字典
root.attrib

十、设置标签文本

添加文本和追加文本

from lxml import etree

root = etree.Element("root")

# 标签内添加文本
root.text="i am autofelix"
# 标签后追加文本
root.tail = "i am autofelix"

十一、xpath方法

from lxml import etree

root = etree.Element("root")

word = root.xpath("//text()")
word[0].getparent().tag

十二、判断文本类型

from lxml import etree

root = etree.Element("root")

word = root.xpath("//text()")
# 是否是text文本
word.is_text
# 是否是tail文本
word.is_tail

十三、字符串解析

from lxml import etree

html = etree.fromstring("autofelix")
html.tag
etree.tostring(html)

十四、XML解析

from lxml import etree

html = etree.XML("autofelix")
html.tag
etree.tostring(html)

十五、去除XML中的空行

from lxml import etree

# 去除xml文件里的空行
parser= etree.XMLParser(remove_blank_text=True)
root = etree.XML(" auto felix ", parser)
print etree.tostring(root)

十六、HTML解析

HTML方法，如果没有和标签，会自动补上

from lxml import etree

html = etree.HTML("autofelix")
etree.tostring(html)

十七、搜索和定位

from lxml import etree

root = etree.XML("i am autofelix")
# findall操作返回列表
root.findall("a")[0].text
# find操作就相当与找到了这个元素节点,返回匹配到的第一个元素
root.find(".//a").text
# 配合列表解析
[ b.text for b in root.findall(".//a") ]
# 根据属性查询
root.findall(".//a[@class]")[0].tag

到此这篇关于python 中 lxml 的 etree 标签解析的文章就介绍到这了,更多相关python etree 标签内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

关键词：追加文本希望大家相关文章这是一个

上一篇：苹果正在测试折叠iPhone：9英寸性能超强

下一篇：Python数据可视化Pyecharts制作Heatmap热力图

为你推荐

泽连斯基声称俄方正策划袭击扎波罗热核电站，白宫：无法证实

“民俗+夜经济”梧林文旅尽显活力|头条

711分考生妈妈：别把精力全投给孩子基本信息讲解

谭松韵和钟汉良主演的电视剧_钟汉良主演的电视剧-每日消息

吴昕的真正男朋友是谁_个人信息和相识背景

深圳公交222路（关于深圳公交222路介绍）|全球滚动

工业母机，谁是盈利最强企业？

国产90nm的光刻机，经多重曝光后，能生产28nm芯片？

蓝牙音箱中应用的国产蓝牙芯片

蔚来手机，真的来了！-环球最新

天天视讯！与EUV相比，这一光刻技术更具发展潜力

2022年光刻机市场：ASML占82%，日系占18%，国产为0？

X 关闭

网络

家庭宽带IPv6地址使用揭秘

家庭宽带IPv6地址使用揭秘

当前消息！家庭宽带IPv6地址分配揭秘

5G如何彻底改变物联网功能

网络自动化如何简化网络运营？

如何让业主和设施管理人员实现智能建筑

X 关闭

专题

2023年“中国有约·相约福建” 国际媒体主题采访活动在泉州启动当前播报

国网泉州供电公司：为变压器“防暑降温” 全力保障迎峰度夏电力供应|微资讯

泉州市举办年轻干部专题研讨班博士选调生和硕士引进生首次集中培训全球快资讯

第四届漳州食交会暨第三届龙海食博会开幕！现场签约总投资额达126亿元（视频）-天天百事通

天天新动态：诏安官陂：筑牢防火墙，消防演练进企业

“凤鸣于溪——安溪历史文化展”即将亮相国博

安溪首届“泛茶杯”武术邀请赛开赛

商用

15G资费不大降！三大运营商谁提供的5G网速最快？中国信通院给出答案

2联想拯救者Y70发布最新预告：售价2970元起迄今最便宜的骁龙8+旗舰

3亚马逊开始大规模推广掌纹支付技术顾客可使用“挥手付”结账

4现代和起亚上半年出口20万辆新能源汽车同比增长30.6%

5如何让居民5分钟使用到各种设施？沙特“线性城市”来了

6AMD实现连续8个季度的增长季度营收首次突破60亿美元利润更是翻倍

7转转集团发布2022年二季度手机行情报告：二手市场“飘香”

8充电宝100Wh等于多少毫安？铁路旅客禁止、限制携带和托运物品目录

9好消息！京东与腾讯续签三年战略合作协议加强技术创新与供应链服务

10名创优品拟通过香港IPO全球发售4100万股全球发售所得款项有什么用处？