标签: 

正在查看 47 个帖子:1-47 (共 47 个帖子)
  • 作者
    帖子
  • @43617 回复 ⚑举报 

    未曾
    管理员

    首先,推荐大家使用dezoomify-rsbookget工具

    为了减少软件的依赖,这里测试一个使用浏览器(建议Chrome)打包下载IIIF资源的小工具

    使用说明

    1,适合大多数IIIF框架的分享平台(已知:不支持台北故宫),默认获取full参数的图片(可能受API限制不是最大)

    2,这里填写的不是分页的json地址,而是Manifest(所有页)的参数地址。例如哈佛大学图书馆的资源Manifest

    日本国立国会图书馆的Manifest地址

    京都大学附属图书馆的Manifest地址

    3,填入manifest.json文件的地址,例如:

    https://rmda.kulib.kyoto-u.ac.jp/iiif/metadata_manifest/RB00013014/manifest.json

    点提交,开始获取

    获取完成后会在浏览器的下载文件夹中~

    2022年11月22日:增加打包成PDF文件的功能

    2022-11-22_142031

    在线工具测试地址

    ok.daoing.com/iiif/

    @43621 回复 ⚑举报 

    xiaopengyou
    游客

    測試了哈佛圖的一本書,下了約三分之一出錯,供  先生了解。

    @43623 回复 ⚑举报 

    白木
    游客

    实测成功。

    之前有一个下载项。官方下载失败几次后,尝试用bookget下载,下载速度较慢,且下载后,经常会出现单张图片显示不全。

    最后多次把下载失败的单图删除后,下载多次,最终下载完全。

    这回使用这个在线工具下载,速度快,而且图片全部是完整的。

    但bookget只需要输入url地址,不需要自己去找json地址。这一点上比较傻瓜式一些。

    而这个工具,需要自己去探寻到json地址,普适性比较强,只要是IIIF并且找到了json地址就都适用。但技术门槛会略比傻瓜式的高那么一点点。

    @43624 回复 ⚑举报 

    xiaopengyou
    游客

    @xiaopengyou #43621

    測試成功!

    @43630 回复 ⚑举报 

    zhudw
    游客

    终于提供IIIF服务器下载了,能省事很多。

    @43634 回复 ⚑举报 

    大道之行
    游客

    測試成功 站長威武

    @43682 回复 ⚑举报 

    弦音雅然
    游客

    感谢未曾老大,真是有问必答,孜孜以教,细心细致,感谢~~

    @43739 回复 ⚑举报 

    tigershuai
    游客

    请问先生,这个可以支持原版大图下载吗?

    @43743 回复 ⚑举报 

    未曾
    管理员

    @tigershuai #43739

    受API限制长边的就不行。这种就需要拼图

    @43806 回复 ⚑举报 

    初夏时光君
    游客

    @未曾 #43743

    请问先生,用小工具下载https://iiif.lib.harvard.edu/manifests/ids:723368,下载出来图片的大小还是很小是因为哈佛图书馆的限制吗?未开放大图下载。

    @43824 回复 ⚑举报 

    zhudw
    游客

    @初夏时光君 #43806

    这张图最大就是512 x 301 像素的。

    @43835 回复 ⚑举报 

    小朋友
    游客

    谢谢两位大神!测试成功,流畅!

    @43836 回复 ⚑举报 

    小朋友
    游客

    @43837 回复 ⚑举报 

    小朋友
    游客

    方便快捷!

    @43840 回复 ⚑举报 

    初夏时光君
    游客

    @zhudw #43824

    好的,非常感谢。

    @44045 回复 ⚑举报 

    轩辕十四
    游客

    您好未老师,请问日本国立国会图书馆:https://dl.ndl.go.jp/info:ndljp/pid/11892800?tocOpened=1

    将链接填入多册后:

    无论用IDM或motix都下载失败,麻烦您看下,不知是哪里不对?

    @44046 回复 ⚑举报 

    轩辕十四
    游客

    @轩辕十四 #44045

    @44050 回复 ⚑举报 

    轩辕十四
    游客

    上面用的是国立国会多册  ok.daoing.com/dl/index2.php

    或者IIIF工具能一次提取多页吗?还是得逐册点击manifest.json?

    @44051 回复 ⚑举报 

    xiaopengyou
    游客

    @轩辕十四 #44045

    這一本貌似沒有IIIF的符號啊

    @44053 回复 ⚑举报 

    xiaopengyou
    游客

    @轩辕十四 #44045

    有有有,看錯了,不好意思

    @44054 回复 ⚑举报 

    未曾
    管理员

    @轩辕十四 #44050

    一册一册的下(使用此工具的话),或者使用bookget

    每册的manifest.json文件在

    填入到
    ok.daoing.com/iiif/

    就能打包下载了

    @44055 回复 ⚑举报 

    xiaopengyou
    游客

    @轩辕十四 #44050

    逐冊下,得用這個  ok.daoing.com/iiif/

    @44056 回复 ⚑举报 

    xiaopengyou
    游客

    @未曾 #44054

    單獨用這個 ok.daoing.com/iiif/

    可以打包下啊?

    @44057 回复 ⚑举报 

    未曾
    管理员

    @xiaopengyou #44056

    一册的打包

    @44059 回复 ⚑举报 

    xiaopengyou
    游客

    @未曾 #44057

    個人理解有錯,以為是三冊打包,哈哈,感謝!

    @44060 回复 ⚑举报 

    轩辕十四
    游客

    @xiaopengyou #44053

    @未曾 #44054

    感谢先生秒回复。

    先生意思是如果要用“IIIF下载器”只能 逐册复制“manifest.json”下载对吧?不知能否方便改成多册下载?

    因为我用先生的国立国会的单册或多册URL:  ok.daoing.com/dl/index2.php   得出的链接,IDM或motix都报错。。

    得出链接在帖子里粘贴不了,不知是否我自己这边下载问题。。

    @44061 回复 ⚑举报 

    未曾
    管理员

    @轩辕十四 #44060

    不能~

    只有几册啊,点三下就好了

    那种老接口的下载会有30s间隔的限制(就是连续任务需要间隔30秒)。

    建议使用打包下载或者使用bookget

    @44062 回复 ⚑举报 

    轩辕十四
    游客

    @未曾 #44061

    收到,感谢先生!

    @44075 回复 ⚑举报 

    zhudw
    游客

    @未曾 #44061

    先生,或许可以考虑弄一个在线版的dezoomify-rs,用PHP调用它。这样就不依赖本地版了。

     

    @44097 回复 ⚑举报 

    未曾
    管理员

    @zhudw #44075

    我的开发能力非常有限啊,还是期待大神你发力啊~

    而且浏览器的canvas 绘图有限制

    Chrome: 最大 高度/宽度: 32,767 像素 最大范围: 268,435,456 像素 (例如:16,384 x 16,384) Firefox: 最大 高度/宽度: 32,767 像素 最大范围: 472,907,776 像素 (例如:22,528 x 20,992)

    @50669 回复 ⚑举报 

    xiaopengyou
    游客

    @未曾 #43617

    請教  先生

    是否美國國會圖書館一書有多卷式的資源,就無法使用IIIF下載器?

    幾天前有位朋友求書發了2個鏈接,好巧不巧,第一個鏈接只有一卷,試了可以用IIIF下載器使用,以為美國會圖的資源都可以用;但剛自己用IIIF下載多卷式的資源,試了幾次卻都只下到第一卷的資料,故向  先生請教。

    感謝

    @50673 回复 ⚑举报 

    未曾
    管理员

    @xiaopengyou #50669

    美国国会图书馆似乎没有分册的manifest.json 链接

    或者有,但是没公布分册的manifest.json地址

    @50674 回复 ⚑举报 

    xiaopengyou
    游客

    @未曾 #50673

    了解,感謝  先生的指教,謝謝。

    @64544 回复 ⚑举报 

    冰冰前男友
    游客

    Harvard图书馆-Digital Collections-IIIF图像爬虫

    blog.csdn.net/m0_38.../105747548

     

    代码:https://github.com/Whu-wxy/HarvardDownloader

    有代码,如果使用?

    @64548 回复 ⚑举报 

    修隐者
    游客

    @冰冰前男友 #64544

    有没有能有爬取pdf的,我有知识星球会员但是每次需要点开一个一个下载,每次下载还是单独弹窗

    @68120 回复 ⚑举报 

    未曾
    管理员

    2022年11月22日:增加打包成PDF文件的功能

    @68122 回复 ⚑举报 

    修隐者
    游客

    @未曾 #68120

    666

    @70860 回复 ⚑举报 

    老白
    游客

     IIIF 资源的小工具 解析下载完了 找不到文件什么原因

    微信截图_20221208161940

    @70862 回复 ⚑举报 

    未曾
    管理员

    @老白 #70860

    因为生成PDF的时间比较长

    换成ZIP试试

    @73142 回复 ⚑举报 

    崔洪章
    游客

    先是选择pdf格式,完成后找不到文件;再选择zip格式,速度快很多,在设定的下载目录找到,解压正常。屏幕截图 2022-12-26 070253

    @125582 回复 ⚑举报 

    坐拥书城
    游客

    今天我用IIIF 下载器下载京都大学图书馆一种古籍,很不顺利,总是半途报错,最后一次显示成功了,但不知下载到哪个文件夹了。

    @125591 回复 ⚑举报 

    xiaopengyou
    游客

    @坐拥书城 #125582

    在C盤的下載文件夾(download)找找。

    用iiif下載器下載不順,比較大的原因應該是網路問題

    @129379 回复 ⚑举报 

    游客

    感謝未曾老師開發工具。今天用這個工具試了一下下載《大般若波羅蜜多經》,換了多個瀏覽器都無反應。有注意到找到的json不像老師提供的案例是以manifest.json結尾,也有嘗試調整位置,也沒成功(ZIP和PDF都有嘗試)。不知可否請老師指點一下。非常感謝!
    書冊json如下:http://jodoshuzensho.jp/zojoji/koryo/manifests/001/001/0001/koryo_001_001_0001.json

    @129597 回复 ⚑举报 

    高山流水
    游客

    未曾老師,下面这个工具怎么都打不开?

    ok.daoing.com/iiif/

    @131241 回复 ⚑举报 

    高山流水
    游客

    未曾老師,这什么情况?P~LO@Z9NG76L(_[6D3NH@IN

    @131242 回复 ⚑举报 

    未曾
    管理员

    @高山流水 #131241

    可能是这个manifest.json符合标准吧

    @136166 回复 ⚑举报 

    哦嚯
    游客

    显示完成了、文件完全找不到。。。。

正在查看 47 个帖子:1-47 (共 47 个帖子)
正在查看 47 个帖子:1-47 (共 47 个帖子)

上传图片

拖拽或点击选择图片(最多五张)

回复至:【测试】一个浏览器打包下载IIIF资源的小工具
您的信息:



发帖/回帖前,请了解相关版规

0,邮箱地址尽量真实有效,随意填写的可能会被系统误判为垃圾内容。
1,不要开书单。单个帖子尽量发布一种书籍需求。
2,在搜索不到相关主题的情况下,尽量发新帖(发帖标题最好带上书名)。不要在他人帖子中回复某种书籍需要。
3,发帖提问标题尽量简单明了。发帖内容不要太过简略,请对书籍内容、版本或作者作简要说明。
4,出版于1973年以后的资源需求或分享将会被清理删除。