[已解决问题] 请教在.net下如何解决PDF转换为TXT格式并检索相关数据
提问时间: 2008-03-27 11:40
悬赏分:50 浏览:315 次

如题,在.net下如何解决PDF转换为TXT格式并检索相关数据

需要什么插件或者工具,思路又是怎样的


提问者:黑*马 - 初学一级
最佳答案
http://itextsharp.sourceforge.net/tutorial/index.html
3/27/2008 2:06:34 PM 回答者:deerchao


提问者对于答案的评价:虽然没有解决我的问题,但是我还是很感谢你,因为我的是扫描的pdf文件
其它回答(3)
去找一个可以读取 pdf的开源组件, 只要能获取里面的内容其它的就有办法了.
1个月前   回答者:沙加 - 老鸟四级
去这里看看,应该能找到答案

http://www.411asp.net/home/assembly/document/pdf
1个月前   回答者:Wilensky - 小虾三级
query.dll可以完成
1个月前   回答者:暗香浮动 - 菜鸟二级
评论
1个月前   黑*马 :
http://itextsharp.sourceforge.net/tutorial/ch09.html
不知道可否解决中文问题
1个月前   黑*马 :
http://text-mining-tool.com/download.php
这个工具,先放在这里
1个月前   黑*马 :
http://www.yimeizs.cn/software/p325/A32540000.shtml
http://www.codeproject.com/KB/cs/PDFToText.aspx
1个月前   暗香浮动 :
http://sourceforge.net/project/showfiles.php?group_id=143466/
到这儿看看这个项目就好了
我的也是根据这个项目做的。
1个月前   黑*马 :
 @暗香浮动 ,这个是提取pdf文本的吗?
1个月前   黑*马 :
http://genmicha.cn/pdf-to-text.htm
http://snowtide.com/DownloadsList
http://pdftextonline.com/q/
1个月前   黑*马 :
结论,对自己扫描的pdf文件,中文的根本就是读不出来,只能是tif文件进行识别
   您需要登录以后才能回答!
我的问题    我要提问


快到期问题

> 问题排行榜

有不合适内容,建议去除