html如何转成doc[x]?(要包含带外链的图片!)


RT,如何能使html转成doc文件,尤其是兼容图片!

目前测试用JODConverter + OpenOffice,生成的doc文件中无法显示图片!
原因在官方邮件列表中提到是因为html中图片是外链。

尝试使用 DATA URL SCHEME 把图片数据存入html文件中,也无法正常显示图片!

请问,html2doc大家都是怎么实现的?解决方案不限于java~

java word HTML

魔法G之敌 10 years ago

我提供一个我以前使用的方案,仅供参考。
客户要将表格导出成一个Excel文件让他下载下来。一开始我还想不怕这个啊,我大Python有操作excel的包啊。但一看xlrd的文档,生成个表格那么麻烦,我就不想干了。我想我的表格又不需要画多复杂的表头,于是我就直接将表格用HTML Table输出成html文件,但在返回的HTTP的Content-Disposition中将文件名称指定成xxx.xls。这样,在Windows上就被当成EXCEL文件直接打开了,Excel也会自动将HTML中的表格转换成它的表格。

你可以这样,直接输出html,但在下载文件的header中将文件名称指定成xxx.docx。可能结果格式不太好看,不过这可以慢慢调嘛。至于图片,可以尝试下IE支持的 MHTML 格式,它可以内嵌图片,我记得Word应该是可以识别MHTML格式中的图片的。

ljokp answered 10 years ago

Your Answer