【ZEROから始めるデータ分析】初めてのJupyter Notebook

目次

はじめに

データ分析を始めるにあたり分析により適したPythonの実行環境が現在Jupyter Notebookであり、参考資料などを見て学習した知見をまとめます。

僕自身はProgate(プロゲート)を軽く1周、独習Pythonで知識を補填しながら1週間前後で触り始めたのですが、Jupyter NotebookはPythonコードがなんとなく理解できれば使えてしまいました!

業務ではスプレットシートを使用していたのですが、何万行のcsvデータを取り込み、関数を走らせていたので途中でカクカクして止まったり・・・非常にストレスフルでイライラが募っていました。また、様々なデータをプログラミング的に操作したいと思っていたところ、Jupyter Notebookは僕にとってもぴったりでした。

予測を立てる上で機械学習を取り入れながら精度の高い分析をするために必須のツールになっていて自分の備忘録もかねて、まずはJupyter Notebookの概要や簡単な使い方を説明したいと思います!

クマくん
クマくん

もう何度スプレットシートが止まって待たされたことか・・・

さめさん
さめさん

まぁスプレットシートはEXCELとほぼ一緒だから誰でも簡単に操作することができるメリットはあるけどね。

さめさん
さめさん

クマくんがやっているような膨大なデータを管理操作するならSQLがいいと思うけど、分析や予測をするってなると機械学習を取り入れたくなるよね!

クマくん
クマくん

折角の機会だから勉強してゴリゴリ分析するんだ!!

Jupyter Notebookとは

Jupyter Notebookとはブラウザ上で実行し、実行結果を記録しながらプログラミングを進めるプログラムの対話型実行環境です。

IPython NotebookというPython専用のNotebookがあり、そこから派生してJupyter Notebookが生まれました。

元々はPython専用だったのですが、利便性が高いことに注目したプログラマーがそれぞれが扱う言語にも対応できるように改良を進め、最終的に多言語に対応したNotebook形式のWebアプリケーションに進化しました。 対応している主要な言語(Julia + Python + R)からJupyterと名付けられることになったのです。

さめさん
さめさん

データ分析の現場や、研究機関などでも欠かせない分析ツールになっているんだよ!

クマくん
クマくん

他のPythonの環境と何が違うの?

IDE(総合開発環境)やエディタなどと違う点として

個別のアドホック型分析や学習目的での利用の際に、過去に試した設定値やロジックを振り返って確認できるというメリットがあります。

アドホック分析とは、市場調査やビックデータ処理の際に用いられる分析手法です。 「アドホック」とはラテン語(ad hoc)由来の言葉で、”限定目的のための”という意味合いがあります。 定期的に行われるデータ分析や、項目も内容も決まっているデータ分析と違って、その都度単発的に行われるというのが特徴です。

アドホック分析とは?意味や特徴、他の分析手法もまとめて比較解説

Jupyter Notebookのインストール

Jupyter Notebookは様々なPythonのライブラリを併用してこそよりその能力を発揮します。

そのため、様々なPythonのライブラリを最初から一気に導入してくれるAnacondaをインストールしましょう

※Anacondaのパッケージの中にJupyter Notebookとそれに関連するライブラリが全て含まれています。

あわせて読みたい
【ZEROから始めるデータ分析】Anacondaを使ってPython3をmacにインストールしてみよう 【はじめに】 macOS や Linux には Python 2.7 が /usr/bin/python に入っていますが、すでにサポートは終了しています。 2020年10月現在ではPython3が最新バージ...

Jupyter Notebookの起動

Anacondaから開いてみよう

Anacondaをmacで開いてみましょう。

※Applicationsの中から、もしくはSpotlight検索からAnaconda Nagivatorと入力してみましょう。

そうすると下記のようにjupyter NotebookがTOP画面に出ているのでLaunchから起動しましょう。

以下のような画面に映ったら起動完了です。

最初は PCのホームディレクトリにいると思うので

  1. ノートブックを作成したいディレクトリを指定または作成
  2. 右側のNewをクリック
  3. 実行言語をPython3で選択

の順で選択していきましょう。

Jupyter Notebookの使い方

基本的に下記のセルと言われるスペース部分にコードを入力して実行していきます。

セル内は対話形式でコードが実行されていく。(実行はRUNボタンをクリック。)

セル内での改行も可能で複数行コードを記述可能です。

また、codeではなくMarkdownを選択することでマークダウン記法の描写も可能です!

まとめ

Jupyter Notebookの使い方
  • Jupyter Notebookとは対話型実行環境で実行内容を記録してくれる
  • Anacondaのパッケージからインストールしよう
  • コードだけではなくマークダウン記法での描写も可能
基礎の基礎だけどね!

まずはJupyter Notebookの実行環境を整えました。

次回以降はデータの取り込みかたやグラフの描写について触れていきたいと思います!

Pythonの学習に関しては様々本屋には書籍が並んでいますが、下記がおすすめです。

EXCELなども使ったことのない初学者の方

EXCELなどでちょっとPCの操作に慣れている方

他のプログラミング言語を少し触ったことがある方

よかったらシェアしてね!
  • URL Copied!
  • URL Copied!
目次
閉じる