Anaconda 和 Jupyter 的简要介绍

Anaconda 是一个基于数据分析和机器学习的集成环境(给我们集成好了数据分析和机器学习对应的各种环境和模块)。当然,我们也可以用它来完成网络爬虫的各种任务。

Anaconda 官方文档:https://docs.anaconda.com/anaconda/navigator/

文档是纯英文,暂时没有精力翻译这个了哈。

Anaconda 这个集成环境提供了一个十分好用的基于浏览器可视化的编码工具,就是 Jupyter。也就是说,安装了 Anacanda,就默认以及安装好了 Jupyter,不许额外安装。

Anaconda 的安装

首先,在 Anaconda 官网 下载所需版本的 Anaconda 安装包。

由于 Anaconda 的服务器在国外,访问和下载速度可能会比较慢,我们可以使用 清华大学开源软件镜像站 来下载 Anaconda 安装包,这样速度会快很多。

img

下载好以后,运行安装包 exe 文件,一直按照默认的选项,点击下一步安装即可。其中有几个小点说明一下。

首先是安装路径。大家都是程序员,道理都懂,开发软件的安装路径中不要出现中文、空格和特殊符号!可以用驼峰体,顶多用个下划线,别的符号一定不要用!比如 Program Files(x86) 这种就不要用了。一般情况,可以直接安装到磁盘根目录下。

clip_image008

然后是选择环境变量这块。官方不推荐直接加入到环境变量中。添加环境变量会让我们启动 Jupter 更方便,但也没什么必要。按需勾选吧。

clip_image010

最后点击 install 开始安装,可能过程需要时间,耐心等待。

clip_image012

测试安装是否成功:

Jupyter 的基本使用

打开 Jupyter

首先当然要打开 Jupyter。启动 Jupyter 有两种方式:

在终端中录入 jupyter notebook 指令后,表示我们在本机中启动了一个服务。然后会自动打开你的默认浏览器。在启动前,可以先 cd 到项目目录的根目录下,Jupyter 会默认以此目录为根目录打开文件。终端对应的目录就是浏览器打开的 Jupyter 文件管理页面中的根目录。

new 新建

在 Jupter 文件管理页面的右上角,有一个 new 按钮,用来新建文件或文件夹。

img

我们可以新建四种项目:

Jupyter Python 3 源文件的基本使用(重点)

cell 初识

在 Jupyter 中使用 new 创建一个新的 Python 3 文件。我们发现,这跟我们平时使用 PyCharm 创建的 py 文件不同:

img

cell 用来根据不同的模式进行代码和笔记的编写。编写好的代码和笔记可以直接在当前文件中运行,查看到运行结果。

cell 的模式

在菜单栏可以选择 cell 的模式:

img

我们看到,可以选择的 cell 模式有 4 种:Code、Markdown、Eaw NBConvert 和 Heading。我们主要使用前两种模式,即 Code 和 Markdown,接下来详细介绍一下。

Code 模式

Code 模型下的 cell 可以编写 Python 代码。代码可以是一行,也可以是多行。其特点为:

从下面途中的例子可以看出,cell 执行的顺序未必从上至下。后执行的 cell 可以使用前面 cell 产生的数据。

img

Markdown 模式

cell 的 Markdown 模式用于编写笔记。可以使用 markdown 集成好的指令指定文字的样式,也可以使用 html 标签指定文字的样式。

就是普通的 markdown 语法写笔记,没啥好说的。

常用快捷键

导出文件

Jupyter 文件有导出为 markdown 的功能,但是因为会产生格式错误,所以不建议这样导出。更恰当的方式是写好之后将其导出为 HTML 文件:File -> Download as -> HTML

img