正在查看 23 帖子:1-23 (共 23 个帖子)
  • 作者
    帖子
  • @5994 回复

    会飞的鱼
    游客

    未曾老师,这不知能不能帮忙一下,什么格式都可以

    天启二年壬戌科进士履历

    mylib.nlc.cn/web/g...7d72035310

     

     

    @5995 回复

    会飞的鱼
    游客

    未曾老师,早上好

    @6001 回复

    未曾
    管理员

    你新提这两种都是 Flash 模式的(国图较老的数据形式),麻烦些

    @6003 回复

    会飞的鱼
    游客

    谢谢未曾老师,只要未曾老师有办法就行,时间不是问题,等您的好消息

    @6004 回复

    未曾
    管理员

    嗯,好吧
    那说好啊,Flash 格式就这一本啊~

    我描述一下这个过程啊

    首先要通过浏览器抓取到第一页的 Flash 页面地址
    例如此本
    http://mylib.nlc.cn/system/doc/books/你的用户 ID/20140923_01/1987371/1
    获取页面总数:47 页
    自增长(可用 excel 生成)生成为 http://mylib.nlc.cn/system/doc/books/你的用户 ID/20140923_01/1987371/1
    至 http://mylib.nlc.cn/system/doc/books/你的用户 ID/20140923_01/1987371/47

    然后批量下载这些页面 (可以用 idm)

    然后是提取这些 swf 文件的 jpg 图片

    最后将批量导出的 jpg 文件打包为 pdf

    天启二年壬戌科进士履历. 一卷. 明天启时期
    下载: files.shuge.org/wl/?i...Q8ITT64xFL

    **请恕我以下言论的冒犯

    不是你能等,我就是一下就能获取的啊~

    我也是要耗费精力和时间啊

    @6006 回复

    会飞的鱼
    游客

    谢谢未曾老师,又学到一项技能,这也不难的

    @7635 回复

    燃犀小医童
    游客

    @未曾 #6004

    请教老师,您在文中提到的自增长前面的 “浏览器抓取到第一页的 Flash 页面地址” 请问怎么做到的。。我网上查方法,在 inter 工具选项里查看文件,但是还是木有找到,好多记录,不确定哪个是刚才查到带 SWF 的...

    @7636 回复

    未曾
    管理员

    @燃犀小医童 #7635

    你用的什么浏览器啊,请截图你的这个界面

    @7641 回复

    燃犀小医童
    游客

    搜狗浏览器

    @7643 回复

    未曾
    管理员

    @燃犀小医童 #7641

    你可以试试按 F12 看看是什么,我没用过搜狗浏览器。个人建议使用 chrome

    @7649 回复

    燃犀小医童
    游客

    好的老师,我回头换个浏览器。这个麻烦您看下。

    @7650 回复

    未曾
    管理员

    你要点全文阅读才会加载哦 Flash 页面地址

    @7655 回复

    燃犀小医童
    游客

    老师,是不是这个?

    @7656 回复

    未曾
    管理员

    @燃犀小医童 #7655

    不是,是一个 1 的 url,如图

    @7687 回复

    燃犀小医童
    游客

    弄好啦,又会一项技能。谢谢老师!!

    借用老师的图图补充一下。

    链接: pan.baidu.com/s/1uN...PytP6SUICw
    提取码:t4o1

    @7737 回复

    硖川居士
    游客

    只好再次请教,用了上述方法,好像没有找到那个 1 的 url,带 “1” 的都是一些零碎的图片。

    @7738 回复

    未曾
    管理员

    @硖川居士 #7737

    这个不是老的 swf 版本的

    这个是 Flash 模式的(国图较老的数据形式)的获取方法

    @7741 回复

    硖川居士
    游客

    感觉有点复杂,那么请教如图的格式应该如何获取呢?

    @8038 回复

    滨城小渔夫
    游客

    @未曾 #6004

    未曾老师,请问我安照你提供的方法找到了国图网资源《西藏地方是中国不可分割的一部分》的 URL:

    网址

    mylib.nlc.cn/syste...7/559828/1

    ……

    mylib.nlc.cn/syste...559828/610

    ,然后用 IDM 进行下载,但还是下载不了,提示错误,会不会是在 IDM 下载的时候需要填写我的用户名和密码?还是其他什么原因?谢谢!

    错误提示

    @8039 回复

    滨城小渔夫
    游客

    还出现了如下提示,我电脑防火墙设置应该是没有问题,以前用 idm 成功下载过。麻烦了!

    @8040 回复

    未曾
    管理员

    @滨城小渔夫 #8039

    看样子你的 IDM 设置了代理
    取消即可

    @8097 回复

    滨城小渔夫
    游客

    感谢未曾老师,已经按照提示修改 IDM,前面的问题已经解决。但又出现了新问题!

    1、只能下载前 33 页,且是 swf 格式。但第 34 页往后下载下来的都是提示资源不存在的提示图片。前往国图网站,提示由于版权原因,无法浏览 34 以后的页面。请问这样情况是不是就没招了?

    2、已下载的 swf,使用反编译软件 “avi20106 中文版”,结果大部分是切成碎片的小图,这个是哪里没整对,软件的各个功能都已尝试了,还是不行,麻烦提示一下,谢谢!

     

    @8098 回复

    未曾
    管理员

    @滨城小渔夫 #8097

    你应该是国图那边因为版权限制了

正在查看 23 帖子:1-23 (共 23 个帖子)
正在查看 23 帖子:1-23 (共 23 个帖子)
回复于:未曾老师,这不知能不能帮忙一下,什么格式都可以
您的信息: