Day: November 26, 2018

Python爬虫入坑笔记 – XPath快速定位网页内容 XPATH语句可以用来快速定位一个XML文本中的内容,当然也可以是HTML文本,这里我们使用lxml库来解析,达到快速批量获取网页相似内容的功能 安装 $ pip install lxml 基本使用 假设匹配出网页所含所有图片的链接 from lxml import etree import requests html = requests.get(‘http://www.lzu.edu.cn’).content.decode(‘utf-8’)…

Dropbox是一款非常好用的免费网络文件同步工具,是Dropbox公司运行的在线存储服务,通过云计算实现因特网上的文件同步,用户可以存储并共享文件和文件夹。Dropbox提供免费和收费服务,Dropbox的收费服务包括Dropbox Pro 和 Dropbox for Business。在不同操作系统下有客户端软件,并且有网页客户端。 当你在电脑A使用Dropbox时,指定文件夹里所有文件的改动均会自动地”同步”到 Dropbox的服务器,当下次你在电脑B需要使用这些文件时,你只需登录你的账户,所有被同步的文件均会自动下载到B电脑中。同样,你在电脑B对某文件的修改,也会体现在电脑A上,而所有这一切均是全自动的,这样你的文件可以说是随时随地都能保持着最新了。将文件放入一台电脑的Dropbox里面去,文件就能即时的同步到Dropbox的服务器端,这些文件在你任何安装了Dropbox的电脑上都可以访问。你可以用电脑或者移动终端从 Dropbox网站来访问这些文件。 用户可以通过Dropbox客户端,把任意文件丢入指定文件夹,然后就会被同步到云,以及该用户其他装有Dropbox客户端的其他计算机中。 Dropbox文件夹中的文件随后就可以与其他Dropbox用户分享,或通过网页来获取。用户也可以通过网页浏览器来手工上传文件。Dropbox作为存储服务,主要专注于同步和共享。Dropbox支持修订历史纪录,即使文件被删,也可以从任何一个同步计算机中得以恢复。用户通过Dropbox的版本控制,可以知道他们共同作业文件的历史纪录,这样多人参与编辑、再发布文件,就不会因为并发而丢失先前的纪录。版本纪录历史仅限于30天,而通过付费可以实现无限的版本纪录,也就是所谓的 “Pack-Rat”。版本纪录用到了差分编码技术,为了节省带宽和时间,当用户Dropbox文件夹中的文件发生变化后,Dropbox只上传改变的文件部分,并实施同步。尽管桌面客户端对单个文件大小不作限制,而通过网站上传的单个文件大小上限则是300MB。 Dropbox使用亚马逊的S3存储系统来存放文件。 并采用SoftLayer技术来购建后端的基础设施。 Dropbox同步采用SSL传输数据,而存储则通过AES-256进行加密。 当然 Linux 平台下也有着自己的 Dropbox 客户端:…