mujizi 发表于 2013-2-7 19:31:39

gz行知识库前期准备

1:对于WORD中的图片是否可以抓出来?
   
 
2:把WORD文档另存为HTML的页面,可以把里面的代码和样式抓取出来。
     http://www.iteye.com/topic/333676 有详细解说。
 
3:由于WORD文档实现图片的抓取比较麻烦,而且如果通过抓取的方式来做的话,知识点的限制性太大了。
     不利于扩展其它文档类型的知识。
页: [1]
查看完整版本: gz行知识库前期准备