标签归档:lofter

Lofter搬家到Hexo Github Pages

独白: 本来想搬去腾讯云的,因为有学生优惠。可是6.1居然告诉我恭喜我大学毕业,将停止优惠。我才刚买一个月(虽然只有1元),就夭折了。++ ++ 可是我都准备了快要一周了,于是只好搬Github去了。搬家过程一切顺利,这都是因为前期的准备到位。唯一不高兴的是在试七牛的云存储的时候,浪费了10元。因为没有备案的域名不能绑定,而他们的二级域名那么丑。所以最后选择了又拍云。


Lofter文章搬家

先将lofter的文章导出。在用上自己编的python程序,自动生成.md文章,并且下载文章中的图片。同时文章中的图片链接也改成新的链接。
lofter-download

Episode-小插曲

  1. 导出的文章.xml是有问题的。我怀疑是lofter编辑器的问题。
    xml-error
    我的解决办法就是自己去xml中,把乱码删除。问题就解决了。好在只有一处有问题。
  2. 导出的文章生成网页格式混乱。解决办法是用Notepad++把所有文章的 “< p >” 标签一次性全删除。

创建Hexo

接下来就是创建新的hexo了,用上自己第一次制作的hexo主题。直接部署上github。
这个过程很简单,现在写文章稍有麻烦。主要是因为图片的插入很麻烦。这个问题慢慢解决吧。

github-pages绑定域名

第一次设置。官方文档已经说的很清楚了,所以也没遇上什么问题。好像也没什么好记录的。
Using a custom domain with GitHub Pages

竣工

一切都好了。虽然相比图片问题,现在的解决方案比在lofter麻烦,但是几乎是除了这点,其他方面都比lofter好。

回归

折腾了整整一个礼拜。这个礼拜很爽。是时候回归最核心的内容了。少折腾点了。

Lofter图片搬家

图片已经能够下载了,很好~但是缺一步,那就是把文章中的图片链接换成本地连接。当然不能手动了,用PYTHON来做这件事。

代码大概是这样的。


我的想法是,把所有图片链接全部换成是very9s/lofter/*.png的链接形式。好在图片不是很多。到时候在服务器上就直接在根目录下放个lofter文件夹吧。
看,图片链接已经改了。
/////////////////////////////////////////////////////////////////////////////////////

嗯,搬家差不多可以进行了。现在只要再在一些个别的细节做一些调整就可以了。整体框架已完成。

Python下载Lofter图片

现在文章已经能够迁移到Hexo了。但是文章里面的图片链接依旧是LOFTER上的,所以也要把图片搬出来。

1-下载图片

在原来的程序基础上添加下载图片的代码。

很直接,很单纯。。。直接用urlopen然后write。可是才下载一张就被服务器无情地拒绝了。

2-伪装

我就这么裸奔的跑过去,当然被拒绝了。

查找python的官方文档,发现一句话。解决办法就在这里了。

headers should be a dictionary, and will be treated as if add_header() was called with each key and value as arguments. This is often used to “spoof” the User-Agent header, which is used by a browser to identify itself – some HTTP servers only allow requests coming from common browsers as opposed to scripts. For example, Mozilla Firefox may identify itself as “Mozilla/5.0 (X11; U; Linux i686) Gecko/20071127 Firefox/2.0.0.11”, while urllib‘s default user agent string is “Python-urllib/2.6” (on Python 2.6).

——

《urllib.request》

所以我要伪装成浏览器。所以修改代码:

通过添加header来实现


3-大功告成

终于可以快速的下载图片了。图片搬家问题也解决了一大半了。


oh~对了,关于解析博文,由于XML中保持的是HTML数据,所以博文中图片的链接,我是用Beautiful Soup 4.2.0来解析的。

下一步,就是修改XML文件,把博文中的图片链接换成自己的图片链接。

嗯~剩下的下次再来吧。

Lofter搬家Hexo前期工作

搬家的工作,慢慢进行着。不知不觉搬家的主体实验已经做了一大半了。基本上验证了搬家方案的可行性。目前已经成功实验搬到自己的centos7虚拟机上。

1-python编程

文章那么多,手动搬家时不可能的了。所以我用python编程,帮我解析Lofter的XML文件,自动生成文章。


目前只是实验性,功能没有完全达到目标。还有实现将Lofter文章中的图片下载到本地上。否则出现这种情况:

生成的文章


2-PSCP上传

用PSCP上传到虚拟机服务器上


嗯,在虚拟机上怎么乱码了?无所谓了,反正文件名也无关紧要
3-Hexo重新生成
访问服务器,发现确实多了多篇文章,但是没有全。只有几篇。还有文章出现乱码。
4-Hexo文章乱码解决

配置 _config.yml


重新生成。。。。。
啊哟,出错了?什么情况?找了有一段时间。原来,官方文档有说冒号之后要有空格。

重新修改配置 _config.yml

重新生成。。。。。


OK没问题。可是乱码的问题还是存在。再看文章编码,原理是文章编码的问题。

于是修改python程序,用UTF-8编码方式保存文章


于是,乱码问题解决了。 5-解决文章不全问题

文章不全是因为中文的文件名,虚拟机无法识别。所以把文件名都改成数字就可以读取所有文章了。

OK了,这些全部都能显示了

////////////////////////////////////////////////////////////////

嗯,差不多了。有时间再补全其他功能吧。

Lofter不如Tumblr

用过Tumblr,真心觉得比Lofter好上无数倍。

仅仅一个文本编辑就比Lofter好,更不用说其他的了。


恨铁不成刚。

要不是担心有一天Tumblr被墙,我肯定不会用Lofter的。