原因

etree.tostring()中有一个参数method默认为xml,如果不写默认设置,此时每行的后面就会多出一些奇怪的据说是换行字&#13,xpath匹配后面还不会进行截断。

  • 解决方案为:参数method值设置为等于html就行了
 etree.tostring(att,  method='html')

Unicode错误处理

ValueError: Unicode strings with encoding declaration are not supported

  • 不支持本地的utf-8格式
#解决办法
etree.HTML(_html.encode("utf-8"))