- 作者帖子
会飞的鱼游客
会飞的鱼游客未曾老师,早上好
未曾管理员你新提这两种都是 Flash 模式的(国图较老的数据形式),麻烦些
会飞的鱼游客谢谢未曾老师,只要未曾老师有办法就行,时间不是问题,等您的好消息
未曾管理员嗯,好吧
那说好啊,Flash 格式就这一本啊~我描述一下这个过程啊
首先要通过浏览器抓取到第一页的 Flash 页面地址
例如此本
http://mylib.nlc.cn/system/doc/books/你的用户 ID/20140923_01/1987371/1
获取页面总数:47 页
自增长(可用 excel 生成)生成为 http://mylib.nlc.cn/system/doc/books/你的用户 ID/20140923_01/1987371/1
至 http://mylib.nlc.cn/system/doc/books/你的用户 ID/20140923_01/1987371/47
然后批量下载这些页面 (可以用 idm)
然后是提取这些 swf 文件的 jpg 图片
最后将批量导出的 jpg 文件打包为 pdf
天启二年壬戌科进士履历. 一卷. 明天启时期
下载: files.shuge.org/wl/?i...Q8ITT64xFL**请恕我以下言论的冒犯
不是你能等,我就是一下就能获取的啊~
我也是要耗费精力和时间啊
会飞的鱼游客谢谢未曾老师,又学到一项技能,这也不难的
燃犀小医童游客@未曾 #6004
请教老师,您在文中提到的自增长前面的 “浏览器抓取到第一页的 Flash 页面地址” 请问怎么做到的。。我网上查方法,在 inter 工具选项里查看文件,但是还是木有找到,好多记录,不确定哪个是刚才查到带 SWF 的...
未曾管理员@燃犀小医童 #7635
你用的什么浏览器啊,请截图你的这个界面
燃犀小医童游客搜狗浏览器
未曾管理员@燃犀小医童 #7641
你可以试试按 F12 看看是什么,我没用过搜狗浏览器。个人建议使用 chrome
燃犀小医童游客好的老师,我回头换个浏览器。这个麻烦您看下。
未曾管理员你要点全文阅读才会加载哦 Flash 页面地址
燃犀小医童游客老师,是不是这个?
未曾管理员@燃犀小医童 #7655
不是,是一个 1 的 url,如图
燃犀小医童游客
硖川居士游客只好再次请教,用了上述方法,好像没有找到那个 1 的 url,带 “1” 的都是一些零碎的图片。
未曾管理员
硖川居士游客感觉有点复杂,那么请教如图的格式应该如何获取呢?
滨城小渔夫游客@未曾 #6004
未曾老师,请问我安照你提供的方法找到了国图网资源《西藏地方是中国不可分割的一部分》的 URL:
mylib.nlc.cn/syste...7/559828/1
……
mylib.nlc.cn/syste...559828/610
,然后用 IDM 进行下载,但还是下载不了,提示错误,会不会是在 IDM 下载的时候需要填写我的用户名和密码?还是其他什么原因?谢谢!
滨城小渔夫游客还出现了如下提示,我电脑防火墙设置应该是没有问题,以前用 idm 成功下载过。麻烦了!
未曾管理员
滨城小渔夫游客感谢未曾老师,已经按照提示修改 IDM,前面的问题已经解决。但又出现了新问题!
1、只能下载前 33 页,且是 swf 格式。但第 34 页往后下载下来的都是提示资源不存在的提示图片。前往国图网站,提示由于版权原因,无法浏览 34 以后的页面。请问这样情况是不是就没招了?
2、已下载的 swf,使用反编译软件 “avi20106 中文版”,结果大部分是切成碎片的小图,这个是哪里没整对,软件的各个功能都已尝试了,还是不行,麻烦提示一下,谢谢!
未曾管理员@滨城小渔夫 #8097
你应该是国图那边因为版权限制了
- 作者帖子
正在查看 23 帖子:1-23 (共 23 个帖子)
正在查看 23 帖子:1-23 (共 23 个帖子)
正在查看 23 帖子:1-23 (共 23 个帖子)