博客
关于我
命名空间
阅读量:502 次
发布时间:2019-03-07

本文共 3863 字,大约阅读时间需要 12 分钟。

ElementTree API尽可能避免使用前缀,而是使用命名空间(URI)

创建带前缀和命名空间的xml树

# coding:utf-8from lxml import etree#当使用命名空间http://www.w3.org/1999/xhtml时,会自动创建前缀html,并让其与之关联,#如果URL错误,如http://www.w3.org/1999/xhtml33333,则会创建前缀ns0,即
Hello World
'''

ElementTree使用的符号最初是由James Clark提出的

其主要优点就是,它提供了一种不管文档是否使用或定义了哪些前缀,都可以锁定树中任何一个Tag的方式
这样就可以无需使用前缀,使得代码更加清晰和准确

从示例中可以看到,前缀仅在序列化结果时才变得重要

如果命名空间名称过长,比如:http://www.w3.org/1999/xhtml......,
这样代码在变得冗长同时,代码中反复地重新键入或复制字符串也很容易出错
因此,常见的做法是将命名空间存储在全局变量中

要调整命名空间前缀以进行序列化,还可向Element factory函数传递映射,例如定义默认命名空间

# coding:utf-8from lxml import etreeXHTML_NAMESPACE = "http://www.w3.org/1999/xhtml"XHTML = "{%s}" % XHTML_NAMESPACENSMAP = {    'prefix_test' : XHTML_NAMESPACE} # the default namespace (no prefix)xhtml = etree.Element(XHTML + "html", nsmap=NSMAP) # lxml only!body = etree.SubElement(xhtml, XHTML + "body")body.text = "Hello World"print(etree.tostring(xhtml, pretty_print=True))'''输出:
Hello World
'''

使用QName助手类生成或拆分限定tag名

# coding:utf-8from lxml import etreetag = etree.QName('http://www.w3.org/1999/xhtml', 'html')print(tag.localname) #输出:htmlprint(tag.namespace) #输出:http://www.w3.org/1999/xhtmlprint(tag.text) #输出:{http://www.w3.org/1999/xhtml}htmltag = etree.QName('{http://www.w3.org/1999/xhtml}html')print(tag.localname) #输出:htmlprint(tag.namespace) #输出:http://www.w3.org/1999/xhtmlroot = etree.Element('{http://www.w3.org/1999/xhtml}html')tag = etree.QName(root)print(tag.localname) #输出:htmltag = etree.QName(root, 'script')print(tag.text)  #输出:{http://www.w3.org/1999/xhtml}scripttag = etree.QName('{http://www.w3.org/1999/xhtml}html', 'script')print(tag.text) #输出:{http://www.w3.org/1999/xhtml}script

nsmap属性

etree允许通过.nsmap属性查找为节点定义的当前命名空间
请注意,这包括在元素上下文中已知的所有前缀,而不仅仅是它自己定义的那些前缀

# coding:utf-8from lxml import etreeroot = etree.Element('root', nsmap={    'a': 'http://a.b/c'})child = etree.SubElement(root, 'child',nsmap={    'b': 'http://b.c/d'})print(root.nsmap) #输出:{'a': 'http://a.b/c'}print(child.nsmap) #输出:{'b': 'http://b.c/d'}print(len(root.nsmap)) #输出:1print(len(child.nsmap)) #输出:2print(child.nsmap['a'])  #输出:'http://a.b/c'print(child.nsmap['b'])  #输出:'http://b.c/d'#修改返回的dict不会对元素产生任何有意义的影响,对它的任何更改都将被忽略child.nsmap['b'] = 'test'print(child.nsmap['b'])  #输出:'http://b.c/d'

属性上的命名空间工作原理类似,但从2.3版开始,lxml.etree将确保属性使用带前缀的命名空间声明

这是因为XML名称空间规范(第6.2节)不认为未固定的属性名在名称空间中
所以它们最终可能会在序列化解析往返过程中丢失名称空间,即使它们出现在名称空间元素中

# coding:utf-8from lxml import etreeXHTML_NAMESPACE = "http://www.w3.org/1999/xhtml"XHTML = "{%s}" % XHTML_NAMESPACENSMAP = {    'prefix_test' : XHTML_NAMESPACE} # the default namespace (no prefix)xhtml = etree.Element(XHTML + "html", nsmap=NSMAP) # lxml only!body = etree.SubElement(xhtml, XHTML + "body")body.text = "Hello World"body.set(XHTML + "bgcolor", "#CCFFAA")print(etree.tostring(xhtml, pretty_print=True))'''输出:
Hello World
'''print(body.get("bgcolor")) #输出:Noneprint(body.get(XHTML + "bgcolor")) #输出:'#CCFFAA'#还可将XPath与完全限定名一起使用find_xhtml_body = etree.ETXPath("//{%s}body" % XHTML_NAMESPACE)results = find_xhtml_body(xhtml)print(results[0].tag) #输出:{http://www.w3.org/1999/xhtml}body#为了方便起见,可在lxml.etree的所有迭代器中使用“*”通配符,包括标记名和名称空间for el in xhtml.iter('*'): print(el.tag) # any element'''输出:{http://www.w3.org/1999/xhtml}html{http://www.w3.org/1999/xhtml}body'''for el in xhtml.iter('{http://www.w3.org/1999/xhtml}*'): print(el.tag)'''输出:{http://www.w3.org/1999/xhtml}html{http://www.w3.org/1999/xhtml}body'''for el in xhtml.iter('{*}body'): print(el.tag)'''输出:{http://www.w3.org/1999/xhtml}body'''#若要查找没有命名空间的元素,请使用纯标记名或显式提供空命名空间print([ el.tag for el in xhtml.iter('{http://www.w3.org/1999/xhtml}body') ])#输出:['{http://www.w3.org/1999/xhtml}body']print([ el.tag for el in xhtml.iter('body') ])#输出:[]print([ el.tag for el in xhtml.iter('{}body') ])#输出:[]print([ el.tag for el in xhtml.iter('{}*') ])#输出:[]

转载地址:http://ycicz.baihongyu.com/

你可能感兴趣的文章
NIFI从MySql中增量同步数据_通过Mysql的binlog功能_实时同步mysql数据_配置数据路由_生成插入Sql语句_实际操作02---大数据之Nifi工作笔记0041
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_03_来吧用NIFI实现_数据分页获取功能---大数据之Nifi工作笔记0038
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_不带分页处理_01_QueryDatabaseTable获取数据_原0036---大数据之Nifi工作笔记0064
查看>>
NIFI从MySql中离线读取数据再导入到MySql中_无分页功能_02_转换数据_分割数据_提取JSON数据_替换拼接SQL_添加分页---大数据之Nifi工作笔记0037
查看>>
NIFI从PostGresql中离线读取数据再导入到MySql中_带有数据分页获取功能_不带分页不能用_NIFI资料太少了---大数据之Nifi工作笔记0039
查看>>
nifi使用过程-常见问题-以及入门总结---大数据之Nifi工作笔记0012
查看>>
NIFI分页获取Mysql数据_导入到Hbase中_并可通过phoenix客户端查询_含金量很高的一篇_搞了好久_实际操作05---大数据之Nifi工作笔记0045
查看>>
NIFI分页获取Postgresql数据到Hbase中_实际操作---大数据之Nifi工作笔记0049
查看>>
NIFI同步MySql数据_到SqlServer_错误_驱动程序无法通过使用安全套接字层(SSL)加密与SQL Server_Navicat连接SqlServer---大数据之Nifi工作笔记0047
查看>>
NIFI同步MySql数据源数据_到原始库hbase_同时对数据进行实时分析处理_同步到清洗库_实际操作06---大数据之Nifi工作笔记0046
查看>>
Nifi同步过程中报错create_time字段找不到_实际目标表和源表中没有这个字段---大数据之Nifi工作笔记0066
查看>>
NIFI大数据进阶_FlowFile拓扑_对FlowFile内容和属性的修改删除添加_介绍和描述_以及实际操作---大数据之Nifi工作笔记0023
查看>>
NIFI大数据进阶_FlowFile生成器_GenerateFlowFile处理器_ReplaceText处理器_处理器介绍_处理过程说明---大数据之Nifi工作笔记0019
查看>>
NIFI大数据进阶_FlowFile生成器_GenerateFlowFile处理器_ReplaceText处理器_实际操作---大数据之Nifi工作笔记0020
查看>>
NIFI大数据进阶_Json内容转换为Hive支持的文本格式_实际操作_02---大数据之Nifi工作笔记0032
查看>>
NIFI大数据进阶_Json内容转换为Hive支持的文本格式_操作方法说明_01_EvaluteJsonPath处理器---大数据之Nifi工作笔记0031
查看>>
NIFI大数据进阶_Kafka使用相关说明_实际操作Kafka消费者处理器_来消费kafka数据---大数据之Nifi工作笔记0037
查看>>
NIFI大数据进阶_Kafka使用相关说明_实际操作Kafka生产者---大数据之Nifi工作笔记0036
查看>>
NIFI大数据进阶_NIFI的模板和组的使用-介绍和实际操作_创建组_嵌套组_模板创建下载_导入---大数据之Nifi工作笔记0022
查看>>
NIFI大数据进阶_NIFI监控功能实际操作_Summary查看系统和处理器运行情况_viewDataProvenance查看_---大数据之Nifi工作笔记0026
查看>>