正在查看 23 个帖子:1-23 (共 23 个帖子)
  • 作者
    帖子
  • @5994 回复

    会飞的鱼
    游客

    未曾老师,这不知能不能帮忙一下,什么格式都可以

    天启二年壬戌科进士履历

    mylib.nlc.cn/web/g...7d72035310

     

     

    @5995 回复

    会飞的鱼
    游客

    未曾老师,早上好

    @6001 回复

    未曾
    管理员

    你新提这两种都是 Flash 模式的(国图较老的数据形式),麻烦些

    @6003 回复

    会飞的鱼
    游客

    谢谢未曾老师,只要未曾老师有办法就行,时间不是问题,等您的好消息

    @6004 回复

    未曾
    管理员

    嗯,好吧
    那说好啊,Flash格式就这一本啊~

    我描述一下这个过程啊

    首先要通过浏览器抓取到第一页的Flash页面地址
    例如此本
    http://mylib.nlc.cn/system/doc/books/你的用户ID/20140923_01/1987371/1
    获取页面总数:47页
    自增长(可用excel生成)生成为http://mylib.nlc.cn/system/doc/books/你的用户ID/20140923_01/1987371/1
    至http://mylib.nlc.cn/system/doc/books/你的用户ID/20140923_01/1987371/47

    然后批量下载这些页面(可以用idm)

    然后是提取这些 swf文件的jpg图片

    最后将批量导出的jpg文件打包为pdf

    天启二年壬戌科进士履历.一卷.明天启时期
    下载: files.shuge.org/wl/?i...Q8ITT64xFL

    **请恕我以下言论的冒犯

    不是你能等,我就是一下就能获取的啊~

    我也是要耗费精力和时间啊

    @6006 回复

    会飞的鱼
    游客

    谢谢未曾老师,又学到一项技能,这也不难的

    @7635 回复

    燃犀小医童
    游客

    @未曾 #6004

    请教老师,您在文中提到的自增长前面的“浏览器抓取到第一页的 Flash 页面地址”请问怎么做到的。。我网上查方法,在inter工具选项里查看文件,但是还是木有找到,好多记录,不确定哪个是刚才查到带SWF的...

    @7636 回复

    未曾
    管理员

    @燃犀小医童 #7635

    你用的什么浏览器啊,请截图你的这个界面

    @7641 回复

    燃犀小医童
    游客

    搜狗浏览器

    @7643 回复

    未曾
    管理员

    @燃犀小医童 #7641

    你可以试试按F12看看是什么,我没用过搜狗浏览器。个人建议使用chrome

    @7649 回复

    燃犀小医童
    游客

    好的老师,我回头换个浏览器。这个麻烦您看下。

    @7650 回复

    未曾
    管理员

    你要点全文阅读才会加载哦 Flash 页面地址

    @7655 回复

    燃犀小医童
    游客

    老师,是不是这个?

    @7656 回复

    未曾
    管理员

    @燃犀小医童 #7655

    不是,是一个1的url,如图

    @7687 回复

    燃犀小医童
    游客

    弄好啦,又会一项技能。谢谢老师!!

    借用老师的图图补充一下。

    链接: pan.baidu.com/s/1uN...PytP6SUICw
    提取码:t4o1

    @7737 回复

    硖川居士
    游客

    只好再次请教,用了上述方法,好像没有找到那个1 的 url,带“1”的都是一些零碎的图片。

    @7738 回复

    未曾
    管理员

    @硖川居士 #7737

    这个不是老的swf版本的

    这个是 Flash 模式的(国图较老的数据形式)的获取方法

    @7741 回复

    硖川居士
    游客

    感觉有点复杂,那么请教如图的格式应该如何获取呢?

    @8038 回复

    滨城小渔夫
    游客

    @未曾 #6004

    未曾老师,请问我安照你提供的方法找到了国图网资源《西藏地方是中国不可分割的一部分》的URL:

    网址

    mylib.nlc.cn/syste...7/559828/1

    ……

    mylib.nlc.cn/syste...559828/610

    ,然后用IDM进行下载,但还是下载不了,提示错误,会不会是在IDM下载的时候需要填写我的用户名和密码?还是其他什么原因?谢谢!

    错误提示

    @8039 回复

    滨城小渔夫
    游客

    还出现了如下提示,我电脑防火墙设置应该是没有问题,以前用idm 成功下载过。麻烦了!

    @8040 回复

    未曾
    管理员

    @滨城小渔夫 #8039

    看样子你的IDM设置了代理
    取消即可

    @8097 回复

    滨城小渔夫
    游客

    感谢未曾老师,已经按照提示修改IDM,前面的问题已经解决。但又出现了新问题!

    1、只能下载前33页,且是swf格式。但第34页往后下载下来的都是提示资源不存在的提示图片。前往国图网站,提示由于版权原因,无法浏览34以后的页面。请问这样情况是不是就没招了?

    2、已下载的swf,使用反编译软件“avi20106中文版”,结果大部分是切成碎片的小图,这个是哪里没整对,软件的各个功能都已尝试了,还是不行,麻烦提示一下,谢谢!

     

    @8098 回复

    未曾
    管理员

    @滨城小渔夫 #8097

    你应该是国图那边因为版权限制了

正在查看 23 个帖子:1-23 (共 23 个帖子)
正在查看 23 个帖子:1-23 (共 23 个帖子)
回复至:未曾老师,这不知能不能帮忙一下,什么格式都可以
您的信息: