正在查看 13 个帖子:1-13 (共 13 个帖子)
  • 作者
    帖子
  • @35323 回复

    正音悉达
    游客

    台故有些资源是有高清IIIF可以查看的,但是用dezoomify-rs近期总是报错。

    我用的命令行是

    dezoomify-rs -l -H "Referer:https://digitalarchive.npm.gov.tw/Painting/Content?pid=155&Dept=P" --max-idle-per-host 3 --retries 20 --retry-delay 2s --timeout 20s --connect-timeout 20s https://iiifod2.npm.gov.tw/iiif/2/K2A%2FK2A001269N000000004PAA/info.json

    其中资源页面的地址是:https://digitalarchive.npm.gov.tw/Painting/Content?pid=155&Dept=P

    IIIF资源通过dezoomify嗅探到的地址是https://iiifod2.npm.gov.tw/iiif/2/K2A%2FK2A001269N000000004PAA/info.json

    报错有两种:

    一种是红色的,直接报错无法探寻到资源。

    一种是下载到10到20个碎片后,服务器拒绝访问。

     

    有以下心得:

    1、 用台湾的IP,能够更容易抓取到完整的资源,但是也完全凭运气。美国的IP有些也可以。

    2、 凌晨三点多到六点的时间是最容易的,但是也不是天天都可以。有的时候可以很顺利地抓取。

     

    想问问各位朋友及@未曾 先生,针对台故,dezoomify-rs是否有其他更好的参数?针对IIIF资源,有没有更好的取得办法?

    @35341 回复

    未曾
    管理员

    他们服务器不稳定,所以方法不是主要原因。看运气吧~

    @35382 回复

    正音悉达
    游客

    @未曾 #35341

    好的,谢谢未曾先生答疑

    @35524 回复

    正音悉达
    游客

    最近成功抓取了一批材料,说一下心得体会。希望给有同样需求的朋友一些帮助。

    1、确认是台故的服务器有一个“熔断”机制,就是某一件藏品,如果在一定时间内被请求多次,服务器就会熔断,有的时候只是拒绝这一件藏品,所以这个时候换一个藏品请求就可以了,但是有的时候是整个服务器拒绝访问,那不管是换IP还是换藏品都没有用。

    2、所以如果使用dezoomify-rs的命令行,要在前面加一个延时指令,我目前测定的是最好放到300秒,如果是凌晨这样的冷淡时间也可以放到150。命令如下

    #:  TIMEOUT -T 300 & dezoomify-rs -l ~~~

    3、https://dezoomify.ophir.dev/这个网页如果能够掌握节奏,也非常好用,这几天我抓了大概300多张图片,基本上是通过按键精灵脚本加这个网页获取的。虽然慢好在稳定。

     

    简而言之就是要耐心,下载完一张图片等待五分钟再下下一张,这样基本上不需要更换IP,也不会被ban。

     

    PS. 台故的藏品编号和IIIF地址是非常有趣的,有一些显而易见的规律,如果仔细研究加之一定的推敲,是可以取得一些并未公布的资源的。

    @35531 回复

    未曾
    管理员

    @正音悉达 #35524

    感谢先生分享实战经验

    @35676 回复

    limin
    游客

    @正音悉达 #35323

    digitalarchive.npm.gov.tw/Antiq...038;Dept=U

    您好這個能幫我拼一下麽,我折騰半天就是沒弄出來,感謝。

    @35729 回复

    正音悉达
    游客

    链接:https://pan.baidu.com/s/1Ao1bLTzUfNKNk4tQcriDKQ
    提取码:15me

    @limin #35676

     

    @35758 回复

    limin
    游客

    @正音悉达 #35729

    非常感謝,方便加個微信。向您學習如何快速拼臺故的圖。

    微信號:gongyugudao

    376480499@qq.com

    @35760 回复

    limin
    游客

    digitalarchive.npm.gov.tw/Antiq...38;Dept=U#

    您好這個如何探寻到资源到資源?請求幫助。

    @35769 回复

    正音悉达
    游客

    @limin #35760

    这种不带IIIF标志的,大概率是没有高清的图。

    有的通过推导馆藏ID号的规律,可以试着碰碰运气能不能抓取到,有些极个别情况是IIIF服务器里有高清的图,但是web网页上不会展示、

    你发的这个没有

    @35788 回复

    兰亭幽梦
    游客

    台北故宫放出的图已足够多,画类已放的差不多了,书法放的少,特别是手札,

    @35803 回复

    limin
    游客

    @正音悉达 #35769

    感謝您的回復。敬意

    @35865 回复

    老刘飞天
    游客

    @正音悉达 #35729

    请问故宫的名画记还能拼图吗?一直想下下面两幅图。可否帮忙下载分享?谢谢!

    minghuaji.dpm.org.cn/paint...a6e780f07a

    minghuaji.dpm.org.cn/paint...06c5593d81

正在查看 13 个帖子:1-13 (共 13 个帖子)
正在查看 13 个帖子:1-13 (共 13 个帖子)
回复至:关于 dezoomify-rs 在台北故宫 IIIF 资源上的使用问题
您的信息: