最近开始用互联网档案馆存acfun的网页
存了一个月的文章区,感觉这么没头没尾的不得要领,所以问问岛民有没有什么建议,觉得哪些东西应该优先保存,存的话怎么存比较好
存了一个月的文章区,感觉这么没头没尾的不得要领,所以问问岛民有没有什么建议,觉得哪些东西应该优先保存,存的话怎么存比较好
#945948
数量的话,我目前每天可以向档案馆提交25000个链接,这些链接用2-3天可以存完
#946016
按照播放/阅读量进行排序?
#946980
>>Po.946016
试了,但是老实说a站自己的排序功能只针对近几周的热门文章,更久远的内容就没法方便的找了
视频区倒是支持按日期分类排序,用这个功能我搜罗了4万多个14年以前的视频链接,但明显感觉少太多东西没搜出来
试了,但是老实说a站自己的排序功能只针对近几周的热门文章,更久远的内容就没法方便的找了
视频区倒是支持按日期分类排序,用这个功能我搜罗了4万多个14年以前的视频链接,但明显感觉少太多东西没搜出来
#947192
ac自己的搜索就蛮难用的,一时半会儿也想不到怎么判断有价值的文章……
很多老稿件都消失了,补档也不是原版,甚至哲♂学都要打厚码
帮你顶下
很多老稿件都消失了,补档也不是原版,甚至哲♂学都要打厚码
帮你顶下
#950523
>>Po.947192
其实也想过存视频,但是很难批量操作批量往档案馆上传,我的硬盘空间也不够,上传速度也慢,所以直接存文章区的文章反而更有效率
其实也想过存视频,但是很难批量操作批量往档案馆上传,我的硬盘空间也不够,上传速度也慢,所以直接存文章区的文章反而更有效率
#950929
>>Po.946016
我之后又看了一下各分区的排序,倒是可以把检索范围扩大到17年了,但是更久远的内容除了几个15年的文章剩下的就又难找了。
如果主站自己没有的话我也没办法了
我之后又看了一下各分区的排序,倒是可以把检索范围扩大到17年了,但是更久远的内容除了几个15年的文章剩下的就又难找了。
如果主站自己没有的话我也没办法了
#952467
突然发现文章区各分区网页端的加载竟然是无限制的,范围大概涉及到12年到现在的所有文章,虽然隐藏的文章大概不在范围内,但凭着这个又可以接着攒链接了,现在攒了12万个链接,争取这几个月再多存个几十万[^o^]ノ
虽然检索方式还没法搞,总之先把文章存起来
另外17年还是18年之前的文章基本都没有图,应该是之前迁移的时候挂了|ー` ]
虽然检索方式还没法搞,总之先把文章存起来
另外17年还是18年之前的文章基本都没有图,应该是之前迁移的时候挂了|ー` ]
#952561
>>Po.952467
牛的牛的[ノ゚∀゚]ノ
牛的牛的[ノ゚∀゚]ノ
#953469
在各个文章区子版扒下来的文章链接数量总是比子版标记的数字少差不多三分之一到一半,是文章区的统计注水还是有东西检索不到这点不得而知[ ゚∀。]7
攒了19万个链接了
攒了19万个链接了
#953681
存这玩意儿干嘛
#953988
>>Po.953681
为了给主站留一份回忆
为了给主站留一份回忆
#955359
评论区看来存不到,不过能存到文章内容已经很好了,毕竟存档工作我不打算只做一回
现在攒了近43万个链接,考虑到各种出错可能全存完得3个月了,充实[ ゚∀。]
现在攒了近43万个链接,考虑到各种出错可能全存完得3个月了,充实[ ゚∀。]
#955379
[`・ω・]bbb
#955960
存一些活化石老up发的
#955966
评论区才是本体,把一些有经典楼串的文章优先存起来吧
#958318
事实上,这次缓存与其说是归档新内容,不如说是继承前辈们的工作
12-13年时期的文章区已经被存档了,而且内容相当多,仅估计就应有1-10万有效链接,档案馆自己的统计数字还要更多
可惜方便的页码目录没有被存下来,但是如果一个人知道自己要找的东西的ac号,他大概率能找回自己想找到的文章
12-13年时期的文章区已经被存档了,而且内容相当多,仅估计就应有1-10万有效链接,档案馆自己的统计数字还要更多
可惜方便的页码目录没有被存下来,但是如果一个人知道自己要找的东西的ac号,他大概率能找回自己想找到的文章
- 1