原因
etree.tostring()中有一个参数method默认为xml,如果不写默认设置,此时每行的后面就会多出一些奇怪的据说是换行字
,xpath匹配后面还不会进行截断。
- 解决方案为:参数method值设置为等于html就行了
etree.tostring(att, method='html')
Unicode错误处理
ValueError: Unicode strings with encoding declaration are not supported
#解决办法
etree.HTML(_html.encode("utf-8"))