正在查看 23 个帖子:1-23 (共 23 个帖子)
  • 作者
    帖子
  • @5994 回复 ⚑举报 

    会飞的鱼
    游客

    未曾老师,这不知能不能帮忙一下,什么格式都可以

    天启二年壬戌科进士履历

    mylib.nlc.cn/web/g...7d72035310

     

     

    @5995 回复 ⚑举报 

    会飞的鱼
    游客

    未曾老师,早上好

    @6001 回复 ⚑举报 

    未曾
    管理员

    你新提这两种都是 Flash 模式的(国图较老的数据形式),麻烦些

    @6003 回复 ⚑举报 

    会飞的鱼
    游客

    谢谢未曾老师,只要未曾老师有办法就行,时间不是问题,等您的好消息

    @6004 回复 ⚑举报 

    未曾
    管理员

    嗯,好吧
    那说好啊,Flash格式就这一本啊~

    我描述一下这个过程啊

    首先要通过浏览器抓取到第一页的Flash页面地址
    例如此本
    http://mylib.nlc.cn/system/doc/books/你的用户ID/20140923_01/1987371/1
    获取页面总数:47页
    自增长(可用excel生成)生成为http://mylib.nlc.cn/system/doc/books/你的用户ID/20140923_01/1987371/1
    至http://mylib.nlc.cn/system/doc/books/你的用户ID/20140923_01/1987371/47

    然后批量下载这些页面(可以用idm)

    然后是提取这些 swf文件的jpg图片

    最后将批量导出的jpg文件打包为pdf

    天启二年壬戌科进士履历.一卷.明天启时期
    下载: files.shuge.org/wl/?i...Q8ITT64xFL

    **请恕我以下言论的冒犯

    不是你能等,我就是一下就能获取的啊~

    我也是要耗费精力和时间啊

    @6006 回复 ⚑举报 

    会飞的鱼
    游客

    谢谢未曾老师,又学到一项技能,这也不难的

    @7635 回复 ⚑举报 

    燃犀小医童
    游客

    @未曾 #6004

    请教老师,您在文中提到的自增长前面的“浏览器抓取到第一页的 Flash 页面地址”请问怎么做到的。。我网上查方法,在inter工具选项里查看文件,但是还是木有找到,好多记录,不确定哪个是刚才查到带SWF的...

    @7636 回复 ⚑举报 

    未曾
    管理员

    @燃犀小医童 #7635

    你用的什么浏览器啊,请截图你的这个界面

    @7641 回复 ⚑举报 

    燃犀小医童
    游客

    搜狗浏览器

    @7643 回复 ⚑举报 

    未曾
    管理员

    @燃犀小医童 #7641

    你可以试试按F12看看是什么,我没用过搜狗浏览器。个人建议使用chrome

    @7649 回复 ⚑举报 

    燃犀小医童
    游客

    好的老师,我回头换个浏览器。这个麻烦您看下。

    @7650 回复 ⚑举报 

    未曾
    管理员

    你要点全文阅读才会加载哦 Flash 页面地址

    @7655 回复 ⚑举报 

    燃犀小医童
    游客

    老师,是不是这个?

    @7656 回复 ⚑举报 

    未曾
    管理员

    @燃犀小医童 #7655

    不是,是一个1的url,如图

    @7687 回复 ⚑举报 

    燃犀小医童
    游客

    弄好啦,又会一项技能。谢谢老师!!

    借用老师的图图补充一下。

    链接: pan.baidu.com/s/1uN...PytP6SUICw
    提取码:t4o1

    @7737 回复 ⚑举报 

    硖川居士
    游客

    只好再次请教,用了上述方法,好像没有找到那个1 的 url,带“1”的都是一些零碎的图片。

    @7738 回复 ⚑举报 

    未曾
    管理员

    @硖川居士 #7737

    这个不是老的swf版本的

    这个是 Flash 模式的(国图较老的数据形式)的获取方法

    @7741 回复 ⚑举报 

    硖川居士
    游客

    感觉有点复杂,那么请教如图的格式应该如何获取呢?

    @8038 回复 ⚑举报 

    滨城小渔夫
    游客

    @未曾 #6004

    未曾老师,请问我安照你提供的方法找到了国图网资源《西藏地方是中国不可分割的一部分》的URL:

    网址

    mylib.nlc.cn/syste...7/559828/1

    ……

    mylib.nlc.cn/syste...559828/610

    ,然后用IDM进行下载,但还是下载不了,提示错误,会不会是在IDM下载的时候需要填写我的用户名和密码?还是其他什么原因?谢谢!

    错误提示

    @8039 回复 ⚑举报 

    滨城小渔夫
    游客

    还出现了如下提示,我电脑防火墙设置应该是没有问题,以前用idm 成功下载过。麻烦了!

    @8040 回复 ⚑举报 

    未曾
    管理员

    @滨城小渔夫 #8039

    看样子你的IDM设置了代理
    取消即可

    @8097 回复 ⚑举报 

    滨城小渔夫
    游客

    感谢未曾老师,已经按照提示修改IDM,前面的问题已经解决。但又出现了新问题!

    1、只能下载前33页,且是swf格式。但第34页往后下载下来的都是提示资源不存在的提示图片。前往国图网站,提示由于版权原因,无法浏览34以后的页面。请问这样情况是不是就没招了?

    2、已下载的swf,使用反编译软件“avi20106中文版”,结果大部分是切成碎片的小图,这个是哪里没整对,软件的各个功能都已尝试了,还是不行,麻烦提示一下,谢谢!

     

    @8098 回复 ⚑举报 

    未曾
    管理员

    @滨城小渔夫 #8097

    你应该是国图那边因为版权限制了

正在查看 23 个帖子:1-23 (共 23 个帖子)
正在查看 23 个帖子:1-23 (共 23 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:回复 #8039 于 未曾老师,这不知能不能帮忙一下,什么格式都可以
您的信息:



发帖/回帖前,请了解相关版规

1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。