悬赏分:50 浏览:315 次
如题,在.net下如何解决PDF转换为TXT格式并检索相关数据
需要什么插件或者工具,思路又是怎样的
|
1个月前 黑*马 : http://itextsharp.sourceforge.net/tutorial/ch09.html 不知道可否解决中文问题 |
|
1个月前 黑*马 : http://text-mining-tool.com/download.php 这个工具,先放在这里 |
|
1个月前 黑*马 : http://www.yimeizs.cn/software/p325/A32540000.shtml http://www.codeproject.com/KB/cs/PDFToText.aspx |
|
1个月前 暗香浮动 : http://sourceforge.net/project/showfiles.php?group_id=143466/ 到这儿看看这个项目就好了 我的也是根据这个项目做的。 |
|
1个月前 黑*马 : @暗香浮动 ,这个是提取pdf文本的吗? |
|
1个月前 黑*马 : http://genmicha.cn/pdf-to-text.htm http://snowtide.com/DownloadsList http://pdftextonline.com/q/ |
|
1个月前 黑*马 : 结论,对自己扫描的pdf文件,中文的根本就是读不出来,只能是tif文件进行识别 |