正在查看 46 个帖子:1-46 (共 46 个帖子)
  • 作者
    帖子
  • @47028 回复

    墨雲
    游客

    以《天象淵機》举例

    history.zjlib.cn/app/u...ssifyName=

    进入到阅读页面。打开f12,然后ctrl+R刷新,按下图红色划线找到对应资源,在资源代码中搜索pdf

    然后我们找到了
    0002.pdf

    http://history.zjlib.cn/yzfile/yunpan_file/pdf/20220420/7841b6a6-7bf7-43a5-9a23-cd047fae8ca1/pdfImgaes/

    链接的两个部分,接着我们将第二部分的pdfImgaes/替换成第一部分的0002.pdf

    就能得到原pdf文件了,不过水印是硬水印,还是去不掉,但要比直接提取的图片要高清许多

    @47032 回复

    大道至简
    游客

    要注册才能看?

    @47053 回复

    alex66
    游客

    @墨雲 #47028

    请教下拼接后的完整路径是什么?

    @47054 回复

    大道至简
    游客

    打开显示这个
    <div></div>

    @47065 回复

    墨雲
    游客

    @alex66 #47053

    拼接后的源完整pdf网址

    history.zjlib.cn/yzfil...1/0002.pdf

    @47066 回复

    墨雲
    游客

    @大道至简 #47032

    不用注册,你试试参考这里从主页一步一步进去

    new.shuge.org/meet/...post-46013

     

    @47092 回复

    大道至简
    游客

    @墨雲 #47066

    是不是下载多了有IP现在点开链接显示找不到页面
    <div></div>

    @47093 回复

    北海
    游客

    @墨雲 #47028

    楼主太牛了!

    求问楼主我用搜狗浏览器,F12之后为什么没有Header、Preview、Response……那一栏?

    @47094 回复

    墨雲
    游客

    @大道至简 #47092

    也有可能和台故宫类似,地址是变动的,试试从主页一步一步进去

    @北海 #47093

    点击对应元素才会出来,看我图的红点,就是点击的地方,实在没有,截图看看

    @47096 回复

    墨雲
    游客

    @北海 #47093

    或者你直接在elements项目,搜索pdf 也能找到链接,这里不用刷新,不过就是复制起来比较麻烦

    @47102 回复

    鹤文
    游客

    @墨雲 #47096

    感谢楼主提供方法!

    @47111 回复

    大道至简
    游客

    @墨雲 #47094

    大佬能出个步骤图吗我搜索到了但是进不了
    <div></div>

    @47112 回复

    墨雲
    游客

    @墨雲 #47066

    这个网页,我给出过步骤了,你看图,如果有不明白的截图看看

    @47114 回复

    heihoo
    游客

    方法是不错的,但是浙江图书馆,有点小店瓤子,动不动就封IP,你方法好,可是,他封IP。

    @47115 回复

    墨雲
    游客

    @heihoo #47114

    是吗,我一直都能进

    @47129 回复

    heihoo
    游客

    我估计,浙江图书馆的网管也是来这里,看帖子了,否则,他的水平也太差了,只会封IP一个手段。其他的都不会了。

    对了浙江图书馆,如果想实现古籍书的对公众开发,就不要小家子气,只会封IP,学学其他的图书馆放开的态度。既然你的古籍都有水印,你还怕什么?

    @47130 回复

    墨雲
    游客

    或者你们注册登录试试,浙江图书馆可以线上注册,百度 浙江图书馆读者证怎么注册,就能搜索到方法

    @47133 回复

    墨雲
    游客

    @heihoo #47129

    应该没封ip吧,我尝试开代理,换了几个外国地址照样能进,难道是浏览器问题,试试谷歌

    @47136 回复

    heihoo
    游客

    @墨雲 #47133

    不是浏览器的问题,那次头天晚上第一次,进去,浏览了浙江图书馆有公开一种明抄本 “六壬集要四卷”
    history.zjlib.cn/app/u...ssifyName=

    浏览了全部图片,想等第二天,在浏览时,保存,可第二天,网页就打不开了。

     

    直到现在也打不开。拿手机,倒是可以打开。

    @47138 回复

    墨雲
    游客

    @heihoo #47136

    那用手机连接电脑WIFI后,能否打开,如果能,试试用杀毒软件的电脑医生,修复一下 网页打不开  一类的问题,来重置一下DNS看看

    @47139 回复

    heihoo
    游客

    @墨雲 #47138

    杀毒软件的电脑医生 都是流氓软件,从来不用。谢谢你。赶明重启一下,路由,换个IP就好了。

    @47193 回复

    devanci
    游客

    小白问一下,得到之后怎么下载?我用了idm但是无法下载

    @47195 回复

    墨雲
    游客

    @devanci #47193

    拼合成像这个回复的原始pdf链接,idm就能下载了

    @墨雲 #47065

     

    @47198 回复

    devanci
    游客

    还是不行,还被封了ip。。。。

    地址倒是有了,不过不能下。

    @47199 回复

    devanci
    游客

    被封了ip,还是不能下载,感觉被封的有点莫名其妙

    @47219 回复

    云自在
    游客

    还是不会用阿。。按了f12没反应。。。

    @47234 回复

    轩辕十四
    游客

    尝试了下从支付宝里搜索“浙江图书馆”可以成功注册电子读者证并登录,然官网:https://share.zjlib.cn/area/35594/2120里面的“古籍项”还是进不去。。

    @47235 回复

    墨雲
    游客

    @云自在 #47219

    笔记本电脑吗,笔记本电脑要在左下角按Fn+F12才能启动元素窗口,或者试试ctrl+shift+I

    @47236 回复

    墨雲
    游客

    @轩辕十四 #47234

    那更改DNS试试,否则可能真要换ip了

    @47240 回复

    云自在
    游客

    @墨雲 #47235

    然后就不知道了。。希望出详细教程,谢谢

    @47242 回复

    墨雲
    游客

    @云自在 #47240

    你这图怎么直接裂开,加载不出来

    @47244 回复

    墨雲
    游客

    @云自在 #47240

    你成功打开f12元素窗口了吗

    @墨雲 #47028

    @墨雲 #47096

    你按我这其中图的红线打开对应的元素,要先点击数据代码的小窗口,然后按Ctrl+F才能打开数据小窗口的搜索栏,否则打开的会是网页的搜索栏,然后搜索pdf,按搜索栏右边的上下箭头就能跳转含有PDF的位置

    因为数据中含有的pdf项不多,你在含有pdf的地方左右拉动一下,就能找到你所需要的链接数据,按照一楼所说的,拼接起来就行。

    @47247 回复

    大道至简
    游客

    @墨雲 #47244

    发现个问题手机上这个网站能正常打开 浏览器不行大佬有办法解决吗
    <div></div>
    <div></div>

    @47248 回复

    墨雲
    游客

    @大道至简 #47247

    我没遇到过所以也不太清楚具体

    可以试试下列方法,看看行不行

    1.用电脑链接手机热点网络(台式电脑一般需要一个usb网卡才能链接无线网络,笔记本电脑一般都自带无线网卡,直接连接就好)

    2.更改电脑DNS(可以用杀毒软件的电脑医生之类的更改,也可以百度方法)

    3.重置wifi的ip地址

    4.弄个VPN试试

    5.换个浏览器试试

    @47251 回复

    阿里達摩院
    游客

    親測,可以下載。不過浙圖的水印很大,清晰度太差。只能說浙圖太小家子氣,故意通過加水印降低清晰度。

    @47253 回复

    墨雲
    游客

    @阿里達摩院 #47251

    直接提取的png,大小只有1400*700左右,但是从源pdf中提取出的图片原大小有3000*6000左右,还是清晰了不少,一些较小的文字也能看清了,不过pdf文件应该经过压缩,加载、放大图页有点卡

    @47255 回复

    阿里達摩院
    游客

    是的 可以肯定的是這圖通過工具給PDF加水印 導致PDF清晰度降低了很多。

    另外不知道這個這圖採取了什麼方法,只要下載了一本,後續網站都打不開了,必須切換IP了

    @47349 回复

    小刘
    游客

    @墨雲 #47028

    大哥没有显示,是我那里步骤错了吗

    @47350 回复

    墨雲
    游客

    @小刘 #47349

    你没刷新网页,可以按Ctrl+R

    @47353 回复

    读书人
    游客

    图书馆看了帖子就修复了吧

    @47354 回复

    小刘
    游客

    @墨雲 #47248

    大哥我刷新了PDF找出来了,然后后面怎么弄哇,怎么拼成哇

    @47356 回复

    墨雲
    游客

    @墨雲 #47065

    这个是拼好的例子,你对比一下一楼说明,就是把后面那段改掉

    @小刘 #47354

     

    @47357 回复

    小刘
    游客

    @墨雲 #47028

    可以啦,详细看了哈步骤,感谢

    @47477 回复

    xuanyinyaran
    游客

    感谢楼主提供的思路与方法,用比较简捷的方法提取到有关数据,并去除了水印分享如下:

    水陸攻守戰略秘書七種(存五種)-绍兴图书馆

    链接:https://pan.baidu.com/s/1TYWU3uOsXV0HM9359AMJTQ?pwd=8888
    提取码:8888
    --来自百度网盘超级会员V8的分享

    @47479 回复

    墨雲
    游客

    @xuanyinyaran #47477

    虽然你发错贴了,这个是浙江的

    @47481 回复

    xuanyinyaran
    游客

    @墨雲 #47479

    哦,是的。。回错贴子了~

正在查看 46 个帖子:1-46 (共 46 个帖子)
正在查看 46 个帖子:1-46 (共 46 个帖子)

上传图片

拖拽或点击选择图片

回复至:找到一个获取浙江图书馆源 PDF 的方法
您的信息:



初次发帖前:建议先阅读