機械学習本 - 人気 / 新書 / 高評価 書籍一覧 | 技術書の本だな


機械学習 人気本 ランキング

機械学習 新書一覧

本書の内容
オンライン教育プラットフォームUdemyの人気講師が教えるディープラーニングの基礎、第2弾。前作「はじめてのディープラーニング」では、基礎中の基礎であるニューラルネットワークとバックプロパゲーションを初学者にもわかりやすく解説しましたが、本作では自然言語処理の分野で真価を発揮する再起型ニューラルネットワーク(RNN)と、ディープラーニングの生成モデルであるVAE(Variational Autoencoder)とGAN(Generative Adversarial Networks)について実装方法を含めて解説します。もちろんプログラムの実装については、前作を踏襲してPythonのみで行い、既存のフレームワークに頼りません。


[本書の特徴]
・前作を読んでいない方のために、Python、数学、ニューラルネットワークの基礎について解説する章を設けています。
・サンプルプログラムはフレームワークを使わずにPythonのみで記述しています。このため数式をコード化する際の原理が初心者にもわかりやすくなっています。
・サンプルプログラムはSBクリエイティブ株式会社のサイトからダウンロード可能です。
・Python3、Jupyter Notebook、Google Colaboratory対応


第1章 ディープラーニングの発展
ディープラーニングの概要
ディープラーニングの応用
本書で扱う技術
本書の使い方

第2章 学習の準備
Anacondaの環境構築
Google Colaboratoryの使い方
Jupyter Notebookの使い方
Pythonの基礎
NumPyとmatplotlib
数学の基礎

第3章 ディープラーニング基礎
ニューラルネットワーク、ディープラーニングの概要
全結合層の順伝播
全結合層の逆伝播
全結合層の実装
シンプルなディープラーニングの実装

第4章 RNN
RNNの概要
RNN層の順伝播
RNN層の逆伝播
RNN層の実装
シンプルなRNNの実装
RNNが抱える問題

第5章 LSTM
LSTMの概要
LSTM層の順伝播
LSTM層の逆伝播
LSTM層の実装
シンプルなLSTMの実装
文章の自動生成

第6章 GRU
GRUの概要
GRU層の順伝播
GRU層の逆伝播
GRU層の実装
シンプルなGRUの実装
Encoder-Decoder

第7章 VAE
VAEの概要
VAEの仕組み
オートエンコーダの実装
VAEに必要な層
VAEの実装
VAEの派生技術
第8章 GAN
GANの概要
GANの仕組み
GANに必要な層
GANの実装
GANの派生技術
 
内容サンプル
 
User Voice
 
   
発売日 2020/03/16
(4.5)
本書の内容

機械に学習させる調教師への道

【本書の内容】
本書は
Andrew W. Trask, "Grokking Deep Learning",
Manning Publications 2019
の邦訳版です。

本書は「機械が学習する」というテーマのもと、
その根幹を成す「ディープラーニング」という手法を平易に解説した書籍です。

一般に「ディープラーニング」というと、その背景となる数学的厳密性を全面に押し出し、
微に入り細に入る解説が仇となって、面白くなるとばぐちでリタイアすることになりがちです。
本書は数学的厳密性はそこそこに、むしろディープラーニングの全体像を俯瞰し、
ディープラーニングがカバーする範囲とその構築方法、
そしてそのための基礎知識をイメージしてもらえるように工夫しています。

Webアプリケーションを開発する際に、フレームワークによってインフラを意識することなく
サービスを構築できるようなスタイル、と言えばいいでしょうか。

なにはともあれ、最初に提示されるPythonコードを「暗記」してみてください。
それを拡張することで、機械に学習させる「調教師」になれることが分かるはずです。

【本書のポイント】
・数式を使った基礎理論ではなく「扱える」ディープラーニングを学べる
・線形代数、微積分、凸最適化はもちろん、機械学習の知識も前提としない
・ニューラルネットワークの基礎から上位層やアーキテクチャを学べる
・Python 3.x系で実際に試せる

【読者が得られること】
・ディープラーニングの全体像
・ニューラルネットワークの基礎
・学習精度の上げ方

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

 
内容サンプル
 
User Voice
絶対表紙とタイトルで損してるパターンの技術書。

翔泳社のサイトから以下転記

【本書のポイント】
・数式を使った基礎理論ではなく「扱える」ディープラーニングを学べる
・線形代数、微積分、凸最適化はもちろん、機械学習の知識も前提としない
・ニューラルネットワークの基礎から上位層やアーキテクチャを学べる
・Python 3.x系で実際に試せる

【読者が得られること】
・ディープラーニングの全体像
・ニューラルネットワークの基礎
・学習精度の上げ方
・各種フレームワークによる実装法

目次は下記の通り

第1章 ディープラーニング入門|ディープラーニングを学ぶのはなぜか
1.1 ディープラーニングの世界へようこそ
1.2 なぜディープラーニングを学ぶべきなのか
1.3 ディープラーニングを学ぶのは難しい?
1.4 なぜ本書を読むべきなのか
1.5 どのような準備が必要か
1.6 Pythonの知識が必要
1.7 まとめ

第2章 基本概念|機械はどのように学習するか
2.1 ディープラーニングとは何か
2.2 機械学習とは何か
2.3 教師あり機械学習
2.4 教師なし機械学習
2.5 パラメトリック学習とノンパラメトリック学習
2.6 教師ありパラメトリック学習
2.7 教師なしパラメトリック学習
2.8 ノンパラメトリック学習
2.9 まとめ

第3章 ニューラル予測|順伝播
3.1 予測する
3.2 予測を行う単純なニューラルネットワーク
3.3 ニューラルネットワークとは何か
3.4 このニューラルネットワークは何をするか
3.5 複数の入力を持つ予測
3.6 複数の入力:このニューラルネットワークは何をするか
3.7 複数の入力:完全なコード
3.8 複数の出力を持つ予測
3.9 複数の入力と出力を持つ予測
3.10 複数の入力と出力:どのような仕組みになっているか
3.11 予測値に基づく予測
3.12 速習:NumPy
3.13 まとめ

第4章 ニューラル学習|勾配降下法
4.1 予測、比較、学習
4.2 比較
4.3 学習
4.4 比較:ネットワークの予測は正確か
4.5 誤差を測定するのはなぜか
4.6 最も基本的なニューラルネットワーク
4.7 ホット&コールド学習
4.8 ホット&コールド学習の特徴
4.9 誤差から方向と量を割り出す
4.10 勾配降下法の1回のイテレーション
4.11 学習とは誤差を小さくすること
4.12 学習ステップ
4.13 どのような仕組みになっているか
4.14 1つの考えにこだわる
4.15 棒が突き出た箱
4.16 微分係数:テイク2
4.17 知っていないと困ること
4.18 知っていなくてもそれほど困らないこと
4.19 微分係数を使ってどのように学習するか
4.20 ここまでのまとめ
4.21 勾配降下法の分解
4.22 過度の補正を可視化する
4.23 ダイバージェンス
4.24 アルファ
4.25 アルファのコーディング
4.26 暗記する

第5章 一度に複数の重みを学習する|勾配降下法を汎化させる
5.1 複数の入力を持つ勾配降下法による学習
5.2 複数の入力を持つ勾配降下法の説明
5.3 学習ステップを確認する
5.4 1つの重みを凍結する
5.5 複数の出力を持つ勾配降下法による学習
5.6 複数の入力と出力を持つ勾配降下法
5.7 これらの重みは何を学習するか
5.8 重みの値を可視化する
5.9 内積(加重和)を可視化する
5.10 まとめ

第6章 初めてのディープニューラルネットワークの構築|誤差逆伝播法
6.1 信号機の問題
6.2 データの準備
6.3 行列と行列関係
6.4 Pythonで行列を作成する
6.5 ニューラルネットワークを構築する
6.6 データセット全体を学習する
6.7 完全勾配降下法、バッチ勾配降下法、確率的勾配降下法
6.8 ニューラルネットワークは相関を学習する
6.9 重みの圧力
6.10 エッジケース:過学習
6.11 エッジケース:相反する圧力
6.12 間接相関を学習する
6.13 相関を作り出す
6.14 ニューラルネットワークを積み重ねる
6.15 誤差逆伝播法:誤差の原因を突き止める
6.16 誤差逆伝播法はどのような仕組みになっているか
6.17 線形と非線形
6.18 ニューラルネットワークがまだうまくいかないのはなぜか
6.19 条件付き相関の秘密
6.20 ちょっとひと息
6.21 初めてのディープニューラルネットワーク
6.22 誤差逆伝播法のコード
6.23 誤差逆伝播法の1回のイテレーション
6.24 ここまでのまとめ
6.25 ディープニューラルネットワークはなぜ重要か

第7章 ニューラルネットワークの描き方|頭の中で、そして紙の上で
7.1 単純化
7.2 相関の要約
7.3 必要以上に複雑だった可視化
7.4 可視化を単純化する
7.5 さらに単純化する
7.6 このネットワークの予測値を確認する
7.7 図の代わりに文字を使って可視化する
7.8 変数をリンクする
7.9 ここまでのまとめ
7.10 可視化ツールの重要性

第8章 シグナルを学習し、ノイズを取り除く|正則化とバッチ
8.1 MNISTの3層ネットワーク
8.2 そう難しいことではない
8.3 記憶と汎化
8.4 ニューラルネットワークの過学習
8.5 過学習の原因
8.6 最も単純な正則化:早期終了
8.7 業界標準の正則化:ドロップアウト
8.8 ドロップアウトは擬似的なアンサンブル学習
8.9 ドロップアウトのコード
8.10 MNISTでのドロップアウトを評価する
8.11 バッチ勾配降下法
8.12 まとめ

第9章 確率と非線形性のモデル化|活性化関数
9.1 活性化関数とは何か
9.2 標準的な隠れ層の活性化関数
9.3 標準的な出力層の活性化関数
9.4 重要な問題点:入力の類似性
9.5 ソフトマックス関数の計算
9.6 活性化関数を組み込む
9.7 デルタに傾きを掛ける
9.8 出力を傾きに変換する
9.9 MNISTネットワークをアップグレードする

第10章 エッジとコーナーに関するニューラル学習|畳み込みニューラルネットワーク
10.1 複数の場所で重みを再利用する
10.2 畳み込み層
10.3 NumPyでの単純な実装
10.4 まとめ

第11章 言語を理解するニューラルネットワーク|king-man+womanは何か
11.1 言語を理解するとはどういう意味か
11.2 自然言語処理(NLP)
11.3 教師ありNLP
11.4 IMDb映画レビューデータセット
11.5 入力データで単語の相関を捕捉する
11.6 映画レビューを予測する
11.7 埋め込み層
11.8 出力を解釈する
11.9 ニューラルアーキテクチャ
11.10 単語埋め込みを比較する
11.11 ニューロンの意味は何か
11.12 穴埋め
11.13 損失の意味
11.14 King-Man+Woman ≃ Queen
11.15 単語類推
11.16 まとめ

第12章 シェイクスピアのような文章を書くニューラルネットワーク|可変長データのためのリカレント層
12.1 任意長の課題
12.2 比較は本当に重要か
12.3 平均化された単語ベクトルの驚くべき効果
12.4 これらの埋め込みに情報はどのように格納されるか
12.5 ニューラルネットワークは埋め込みをどのように使用するか
12.6 BoWベクトルの限界
12.7 単位行列を使って単語埋め込みを合計する
12.8 まったく何も変更しない行列
12.9 遷移行列を学習する
12.10 有益な文ベクトルを作成するための学習
12.11 Pythonでの順伝播
12.12 逆伝播
12.13 訓練
12.14 ニューラルネットワークを訓練するための準備
12.15 任意長での順伝播
12.16 任意長での逆伝播
12.17 任意長での重みの更新
12.18 実行と出力の解析
12.19 まとめ

第13章 自動最適化|ディープラーニングフレームワークを構築しよう
13.1 ディープラーニングフレームワークとは何か
13.2 テンソルの紹介
13.3 自動勾配計算(autograd)の紹介
13.4 クイックチェック
13.5 繰り返し使用されるテンソル
13.6 複数のテンソルをサポートするために.autogradをアップグレードする
13.7 加算の逆伝播の仕組み
13.8 符号反転のサポートを追加する
13.9 関数のサポートをさらに追加する
13.10 autogradを使ってニューラルネットワークを訓練する
13.11 自動最適化を追加する
13.12 さまざまな層のサポートを追加する
13.13 層を含んでいる層
13.14 損失関数層
13.15 フレームワークをマスターするには
13.16 非線形層
13.17 埋め込み層
13.18 autogradにインデックスを追加する
13.19 埋め込み層:その2
13.20 交差エントロピー層
13.21 リカレント層
13.22 まとめ

第14章 シェイクスピアのような文章を書くための学習|LSTM
14.1 文字言語のモデル化
14.2 T-BPTTはなぜ必要か
14.3 T-BPTT
14.4 出力のサンプル
14.5 勾配消失と勾配発散
14.6 RNNの逆伝播の例
14.7 LSTMセル
14.8 LSTMのゲートを直観的に理解する
14.9 LSTM層
14.10 文字言語モデルを改良する
14.11 LSTM文字言語モデルを訓練する
14.12 LSTM文字言語モデルを調整する
14.13 まとめ

第15章 未知のデータでのディープラーニング|フェデレーションラーニング
15.1 ディープラーニングのプライバシー問題
15.2 フェデレーションラーニング
15.3 スパムの検出を学習する
15.4 フェデレーション環境をシミュレートする
15.5 フェデレーションラーニングのハッキング
15.6 セキュアアグリゲーション
15.7 準同型暗号
15.8 準同型暗号が適用されたフェデレーションラーニング
15.9 まとめ

第16章 次のステップ|クイックガイド
ステップ1:PyTorchを学び始める
ステップ2:別のディープラーニングコースを受講する
ステップ3:数学的なディープラーニングの教科書を読む
ステップ4:ディープラーニングのブログを始める
ステップ5:Twitter
ステップ6:学術論文を書く
ステップ7:GPUを手に入れる
ステップ8:報酬をもらって練習する
ステップ9:オープンソースプロジェクトに参加する
ステップ10:ローカルコミュニティを開拓する
 
   
発売日 2020/03/16
(4.5)
本書の内容
 
内容サンプル
 
User Voice
絶対表紙とタイトルで損してるパターンの技術書。

翔泳社のサイトから以下転記

【本書のポイント】
・数式を使った基礎理論ではなく「扱える」ディープラーニングを学べる
・線形代数、微積分、凸最適化はもちろん、機械学習の知識も前提としない
・ニューラルネットワークの基礎から上位層やアーキテクチャを学べる
・Python 3.x系で実際に試せる

【読者が得られること】
・ディープラーニングの全体像
・ニューラルネットワークの基礎
・学習精度の上げ方
・各種フレームワークによる実装法

目次は下記の通り

第1章 ディープラーニング入門|ディープラーニングを学ぶのはなぜか
1.1 ディープラーニングの世界へようこそ
1.2 なぜディープラーニングを学ぶべきなのか
1.3 ディープラーニングを学ぶのは難しい?
1.4 なぜ本書を読むべきなのか
1.5 どのような準備が必要か
1.6 Pythonの知識が必要
1.7 まとめ

第2章 基本概念|機械はどのように学習するか
2.1 ディープラーニングとは何か
2.2 機械学習とは何か
2.3 教師あり機械学習
2.4 教師なし機械学習
2.5 パラメトリック学習とノンパラメトリック学習
2.6 教師ありパラメトリック学習
2.7 教師なしパラメトリック学習
2.8 ノンパラメトリック学習
2.9 まとめ

第3章 ニューラル予測|順伝播
3.1 予測する
3.2 予測を行う単純なニューラルネットワーク
3.3 ニューラルネットワークとは何か
3.4 このニューラルネットワークは何をするか
3.5 複数の入力を持つ予測
3.6 複数の入力:このニューラルネットワークは何をするか
3.7 複数の入力:完全なコード
3.8 複数の出力を持つ予測
3.9 複数の入力と出力を持つ予測
3.10 複数の入力と出力:どのような仕組みになっているか
3.11 予測値に基づく予測
3.12 速習:NumPy
3.13 まとめ

第4章 ニューラル学習|勾配降下法
4.1 予測、比較、学習
4.2 比較
4.3 学習
4.4 比較:ネットワークの予測は正確か
4.5 誤差を測定するのはなぜか
4.6 最も基本的なニューラルネットワーク
4.7 ホット&コールド学習
4.8 ホット&コールド学習の特徴
4.9 誤差から方向と量を割り出す
4.10 勾配降下法の1回のイテレーション
4.11 学習とは誤差を小さくすること
4.12 学習ステップ
4.13 どのような仕組みになっているか
4.14 1つの考えにこだわる
4.15 棒が突き出た箱
4.16 微分係数:テイク2
4.17 知っていないと困ること
4.18 知っていなくてもそれほど困らないこと
4.19 微分係数を使ってどのように学習するか
4.20 ここまでのまとめ
4.21 勾配降下法の分解
4.22 過度の補正を可視化する
4.23 ダイバージェンス
4.24 アルファ
4.25 アルファのコーディング
4.26 暗記する

第5章 一度に複数の重みを学習する|勾配降下法を汎化させる
5.1 複数の入力を持つ勾配降下法による学習
5.2 複数の入力を持つ勾配降下法の説明
5.3 学習ステップを確認する
5.4 1つの重みを凍結する
5.5 複数の出力を持つ勾配降下法による学習
5.6 複数の入力と出力を持つ勾配降下法
5.7 これらの重みは何を学習するか
5.8 重みの値を可視化する
5.9 内積(加重和)を可視化する
5.10 まとめ

第6章 初めてのディープニューラルネットワークの構築|誤差逆伝播法
6.1 信号機の問題
6.2 データの準備
6.3 行列と行列関係
6.4 Pythonで行列を作成する
6.5 ニューラルネットワークを構築する
6.6 データセット全体を学習する
6.7 完全勾配降下法、バッチ勾配降下法、確率的勾配降下法
6.8 ニューラルネットワークは相関を学習する
6.9 重みの圧力
6.10 エッジケース:過学習
6.11 エッジケース:相反する圧力
6.12 間接相関を学習する
6.13 相関を作り出す
6.14 ニューラルネットワークを積み重ねる
6.15 誤差逆伝播法:誤差の原因を突き止める
6.16 誤差逆伝播法はどのような仕組みになっているか
6.17 線形と非線形
6.18 ニューラルネットワークがまだうまくいかないのはなぜか
6.19 条件付き相関の秘密
6.20 ちょっとひと息
6.21 初めてのディープニューラルネットワーク
6.22 誤差逆伝播法のコード
6.23 誤差逆伝播法の1回のイテレーション
6.24 ここまでのまとめ
6.25 ディープニューラルネットワークはなぜ重要か

第7章 ニューラルネットワークの描き方|頭の中で、そして紙の上で
7.1 単純化
7.2 相関の要約
7.3 必要以上に複雑だった可視化
7.4 可視化を単純化する
7.5 さらに単純化する
7.6 このネットワークの予測値を確認する
7.7 図の代わりに文字を使って可視化する
7.8 変数をリンクする
7.9 ここまでのまとめ
7.10 可視化ツールの重要性

第8章 シグナルを学習し、ノイズを取り除く|正則化とバッチ
8.1 MNISTの3層ネットワーク
8.2 そう難しいことではない
8.3 記憶と汎化
8.4 ニューラルネットワークの過学習
8.5 過学習の原因
8.6 最も単純な正則化:早期終了
8.7 業界標準の正則化:ドロップアウト
8.8 ドロップアウトは擬似的なアンサンブル学習
8.9 ドロップアウトのコード
8.10 MNISTでのドロップアウトを評価する
8.11 バッチ勾配降下法
8.12 まとめ

第9章 確率と非線形性のモデル化|活性化関数
9.1 活性化関数とは何か
9.2 標準的な隠れ層の活性化関数
9.3 標準的な出力層の活性化関数
9.4 重要な問題点:入力の類似性
9.5 ソフトマックス関数の計算
9.6 活性化関数を組み込む
9.7 デルタに傾きを掛ける
9.8 出力を傾きに変換する
9.9 MNISTネットワークをアップグレードする

第10章 エッジとコーナーに関するニューラル学習|畳み込みニューラルネットワーク
10.1 複数の場所で重みを再利用する
10.2 畳み込み層
10.3 NumPyでの単純な実装
10.4 まとめ

第11章 言語を理解するニューラルネットワーク|king-man+womanは何か
11.1 言語を理解するとはどういう意味か
11.2 自然言語処理(NLP)
11.3 教師ありNLP
11.4 IMDb映画レビューデータセット
11.5 入力データで単語の相関を捕捉する
11.6 映画レビューを予測する
11.7 埋め込み層
11.8 出力を解釈する
11.9 ニューラルアーキテクチャ
11.10 単語埋め込みを比較する
11.11 ニューロンの意味は何か
11.12 穴埋め
11.13 損失の意味
11.14 King-Man+Woman ≃ Queen
11.15 単語類推
11.16 まとめ

第12章 シェイクスピアのような文章を書くニューラルネットワーク|可変長データのためのリカレント層
12.1 任意長の課題
12.2 比較は本当に重要か
12.3 平均化された単語ベクトルの驚くべき効果
12.4 これらの埋め込みに情報はどのように格納されるか
12.5 ニューラルネットワークは埋め込みをどのように使用するか
12.6 BoWベクトルの限界
12.7 単位行列を使って単語埋め込みを合計する
12.8 まったく何も変更しない行列
12.9 遷移行列を学習する
12.10 有益な文ベクトルを作成するための学習
12.11 Pythonでの順伝播
12.12 逆伝播
12.13 訓練
12.14 ニューラルネットワークを訓練するための準備
12.15 任意長での順伝播
12.16 任意長での逆伝播
12.17 任意長での重みの更新
12.18 実行と出力の解析
12.19 まとめ

第13章 自動最適化|ディープラーニングフレームワークを構築しよう
13.1 ディープラーニングフレームワークとは何か
13.2 テンソルの紹介
13.3 自動勾配計算(autograd)の紹介
13.4 クイックチェック
13.5 繰り返し使用されるテンソル
13.6 複数のテンソルをサポートするために.autogradをアップグレードする
13.7 加算の逆伝播の仕組み
13.8 符号反転のサポートを追加する
13.9 関数のサポートをさらに追加する
13.10 autogradを使ってニューラルネットワークを訓練する
13.11 自動最適化を追加する
13.12 さまざまな層のサポートを追加する
13.13 層を含んでいる層
13.14 損失関数層
13.15 フレームワークをマスターするには
13.16 非線形層
13.17 埋め込み層
13.18 autogradにインデックスを追加する
13.19 埋め込み層:その2
13.20 交差エントロピー層
13.21 リカレント層
13.22 まとめ

第14章 シェイクスピアのような文章を書くための学習|LSTM
14.1 文字言語のモデル化
14.2 T-BPTTはなぜ必要か
14.3 T-BPTT
14.4 出力のサンプル
14.5 勾配消失と勾配発散
14.6 RNNの逆伝播の例
14.7 LSTMセル
14.8 LSTMのゲートを直観的に理解する
14.9 LSTM層
14.10 文字言語モデルを改良する
14.11 LSTM文字言語モデルを訓練する
14.12 LSTM文字言語モデルを調整する
14.13 まとめ

第15章 未知のデータでのディープラーニング|フェデレーションラーニング
15.1 ディープラーニングのプライバシー問題
15.2 フェデレーションラーニング
15.3 スパムの検出を学習する
15.4 フェデレーション環境をシミュレートする
15.5 フェデレーションラーニングのハッキング
15.6 セキュアアグリゲーション
15.7 準同型暗号
15.8 準同型暗号が適用されたフェデレーションラーニング
15.9 まとめ

第16章 次のステップ|クイックガイド
ステップ1:PyTorchを学び始める
ステップ2:別のディープラーニングコースを受講する
ステップ3:数学的なディープラーニングの教科書を読む
ステップ4:ディープラーニングのブログを始める
ステップ5:Twitter
ステップ6:学術論文を書く
ステップ7:GPUを手に入れる
ステップ8:報酬をもらって練習する
ステップ9:オープンソースプロジェクトに参加する
ステップ10:ローカルコミュニティを開拓する
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
■内容紹介■
Python / Flask と リクルートの 人工知能 API を使って 雑談 LINE bot を作ります。

Google Colaboratoryを使うので環境構築不要ですぐに始められます。

■書籍で扱う内容■
・ Python
・ Flask
・ LINE bot
・ 人工知能 API
・ Heloku
・Google Colaboratory
・ ngrok

■目次■
0.はじめに
1.Google Colaboratory
1-1.Google Colaboratoryとは
1-2.Google Colaboratoryを使ってみる
2.人工知能APIを使ってみる
2-1.リクルートのA3RT(アート)
2-2.APIキー発行
2-3.実装する
2-4.関数化する
3.LINEボット化する
3-1.LINEボットが動く仕組み
3-2.Flaskでローカルサーバーを立ち上げる
3-3.ngrokでローカルサーバーを外から使えるようにする
3-4.LINEボットを実装
4.Herokuへデプロイする
4-1.Herokuとは
4-2.Herokuに登録
4-3.Heroku CLIのインストールとログイン
4-4.Heroku用のファイルを準備
4-5.Herokuにデプロイ
5.おわりに
 
内容サンプル
 
User Voice
 
   
本書の内容
システムトレーダー、エンジニアなどの間で話題沸騰
発売後売り切れの書店続出、大反響につき即増刷決定!

人工知能(AI)、機械学習の発展は金融をどのように変えるのか

理論と実務を熟知した第一人者による比類なき大著“Advance in Financial Machine Learning"(2018年、Wileyより刊行)、待望の日本版刊行!
すでに中国語、韓国語、ロシア語にも翻訳された名著を、実務を知り尽くしたクオンツが日本の読者に向けて翻訳

データの構造化とラべリング、モデリング、バックテスト、ハイパフォーマンスコンピューティングなど、金融工学における機械学習の活用の可能性を、Pythonのコード例を交えて徹底解説

目次
はじめに
第1章 ファイナンス機械学習という新分野
Part1 データ分析
第2章 金融データの構造
第3章 ラベリング
第4章 標本の重み付け
第5章 分数次差分をとった特徴量
Part2 モデリング
第6章 アンサンブル法
第7章 ファイナンスにおける交差検証法
第8章 特徴量の重要度
第9章 交差検証法によるハイパーパラメータの調整
Part3 バックテスト
第10章 ベットサイズの決定
第11章 バックテストの危険性
第12章 交差検証によるバックテスト
第13章 人工データのバックテスト
第14章 バックテストの統計値
第15章 戦略リスクを理解する
第16章 機械学習によるアセットアロケーション
Part4 金融市場分析のための特徴量
第17章 構造変化
第18章 エントロピー特徴量
第19章 マイクロストラクチャーに基づく特徴量
Part5 ハイパフォーマンスコンピューティング
第20章 マルチプロセッシング(多重処理)とベクトル化
第21章 総当たり法と量子コンピュータ
第22章 ハイパフォーマンス計算知能と予測技術
Kesheng Wu and Horst Simon  
内容サンプル
 
User Voice
これまで読んだ全ての投資書の中で文句なしの一位。

データ分析の基礎体力がある人向け。
方法論がメインなので、自分で手を動かして実装できる人じゃないと意味ないです。
quants portalというサイトで前処理プログラムまとめられてるので参考になります。

「作った投資ルールが今後も通用するか」という最も重要で難しい本質的な問題に真正面から取り組んでる点が素晴らしい。
当然、リーケージや過学習といったデータ分析で気をつけるべき点にも注意を払ってます。

幅広い研究活動をされてる原作著者のファンになりました。
抽象度が高く具体例がほとんどないため、金融と機械学習の実務経験者(プロ)以外の人が読んでもまったく理解できないと思います。本書の内容に関する具体例を解説した海外のサイトがあったのですが最近有料化された(1か月100ドルだったと思います)など考えると、個人投資家の範疇ではなく金融機関向けなのかなと思います。
分からないから買った
自分がいつか天才になったら
分かる日が来るのであろう
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
AIエキスパートの知見から得る、新たな視点!
理論と現場を橋渡しする、機械学習の実践的エッセンス。

数式をどう読み解くか。
各手法がどこまで活用できるか。
問題をどう乗り越えるか。

米国で大ブレークの機械学習本を翻訳

機械学習アルゴリズムにおける考え方や数式を示し、
アルゴリズムの特徴、利用条件、長所/短所、活用範囲などを解説。
一気に読める量でありながらも、主要な手法を網羅。

著者は、人工知能分野で博士号を取得、その後は企業で実装を続けています。
本書では、そうして積み重ねた知見を展開。
現実問題に取り組むための知識が得られる貴重な一冊です。

数学や統計学、プログラミングについてあまり高度な知識や経験を求めていませんが
取り上げている手法に時間を費して学べる人なら、かなり読み進められるはずです。

機械学習を学ぶ機会を探している初学者にも、
すでに実務に携わっていてより知識を広げたい熟練者にも適しています。

この分野でPh.D論文の研究をこれから始めようという人にはきっと本書が必要で、
研究が進むにつれて有用な参考書となるでしょう。

◎本書は『The Hundred-Page Machine Learning Book』の翻訳書です。
数学など一定の知識が前提となっています。


※この商品は固定レイアウトで作成されており、タブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。
購入前にお使いの端末で無料サンプルをお試しください。  
内容サンプル
 
User Voice
これ一冊で機械学習を理解するのに必要な用語はひと通り理解できる、騙されたつもりで買っても損はしない、簡潔で非常に良くまとまった分かりやすいお薦めの教科書です。
深層学習についても簡潔で分かりやすい解説が載っています。

巻末に良くできた用語集があるのも助かります。

訳におかしなところがないのもポイント高いです。
40代、職業はプログラマーです。
ここ何年かは、統計学やらなにやらの勉強をしています。

本書は、機械学習のいくつかの手法とその仕組みを、
具体的な数式を追いながら解説していくという本です。
ただし、ソースコードはほとんどありません。

逆に、他の多くの機械学習の入門書は、機械学習のさまざまな手法を、
たいした説明もしないまま、次々と紹介して、
とりあえず、Pythonのscikit-learnのようなライブラリを使った
ソースコードのサンプルを動かしてみるといったことが多いです。

本書は、多くの機械学習の入門書には欠けている、機械学習の仕組みについての
説明があるので、他の本と補完し合えるのは良いと思います。

原著のレビューが良いので、期待していたのですが、
多くの手法の説明を詰め込んでおり、駆け足なので、
自分は、あまり得るものはなかったです。

自分のレベルがあがって、もっとわかるようになってから読めば、
「コンパクトでいい本!」と感じるようになるのだろうか。

ページ数の少なさが本書の売りのようですので、
機械学習の仕組みについて、限られた時間で、
学び得る限りのことを学びたいといったかたには良いかもしれません。
まだこの分野を学び始めたばかりで、入門書を1,2冊読んだだけ
というようなかたにも良いと思います

追記
本の中にはソースコードがほぼ書かれていませんが、
著者のgithubのページには、本書に対応するソースコードがあるようです。

追記
機械学習の仕組みも書いてあるような、比較的近い内容の本としては、
Pythonで学ぶ統計的機械学習
金森 敬文
[第2版]Python 機械学習プログラミング 達人データサイエンティストによる理論と実践
Sebastian Raschka
ゼロからはじめるデータサイエンス ―Pythonで学ぶ基本と実践
Joel Grus
あたりなんだろうか。
基本的な用語から、関数がどうしてそうなっているのかの背景まで、読みやすくまとめられています。

コードをどんどん書かせる系の本も重要なのですが、このように「読み物」としてまとまっていると、学習に対するモチベーションが上がります。

2〜3冊程度、コードを書く系の本を読んだら手を出してみると丁度いいと思います。
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
発売日 2019/12/17
(3.5)
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、Policy GradientとA2Cの記述・実装を見直した。・Pythonプログラミングとともに、ゼロからていねいに解説。・コードが公開されているから、すぐ実践できる。・実用でのネックとなる強化学習の弱点と、その克服方法まで紹介。【おもな内容】Day1 強化学習の位置づけを知る 強化学習とさまざまなキーワードの関係 強化学習のメリット・デメリット 強化学習における問題設定:Markov Decision Process Day2 強化学習の解法(1): 環境から計画を立てる 価値の定義と算出: Bellman Equation 動的計画法による状態評価の学習: Value Iteration 動的計画法による戦略の学習: Policy Iteration モデルベースとモデルフリーとの違いDay3 強化学習の解法(2): 経験から計画を立てる 経験の蓄積と活用のバランス: Epsilon-Greedy法 計画の修正を実績から行うか、予測で行うか: Monte Carlo vs Temporal Difference 経験を価値評価、戦略どちらの更新に利用するか:Valueベース vs PolicyベースDay4 強化学習に対するニューラルネットワークの適用 強化学習にニューラルネットワークを適用する 価値評価を、パラメーターを持った関数で実装する:Value Function Approximation 価値評価に深層学習を適用する:Deep Q-Network  戦略を、パラメーターを持った関数で実装する:Policy Gradient 戦略に深層学習を適用する:Advantage Actor Critic (A2C) 価値評価か、戦略かDay5 強化学習の弱点 サンプル効率が悪い 局所最適な行動に陥る、過学習をすることが多い 再現性が低い 弱点を前提とした対応策Day6 強化学習の弱点を克服するための手法 サンプル効率の悪さへの対応: モデルベースとの併用/表現学習 再現性の低さへの対応: 進化戦略 局所最適な行動/過学習への対応: 模倣学習/逆強化学習Day7 強化学習の活用領域 行動の最適化 学習の最適化  
内容サンプル
 
User Voice
あまりちゃんと読んでいませんが、colabのアニメーション非対応のコードだったので、macでminiconda等の環境構築を試みましたが、動かず3日無駄にしました。

自前でGPU積んだPCを用意するかAWSで有料の環境構築が必要です。
後で買った他の書籍だとcolabやtry jupyterでできるように書かれていました(後半は少し改変する必要がありましたが)。導入のところは簡単にできる様にして欲しかったです。

また改訂版で誤植を無くしてるはずなのに誤植が多いです。P.7ですでにtensorflowのバージョンが0.12->0.14へあげたと書かれていますが1.12->1.14かなと思うし、なんか誤植が多いイメージでした。
自分にはコードも分かりづらかったです。

説明はそこそこ丁寧かも、でもそれはwebの情報でまかなえる。
コードを簡単に動かしたかったのですがその需要は満たされなかったです。
こちらの書籍で強化学習を勉強中ですが、図やソースコードがたくさんあり、数式が少なめでわかりやすいと思いました。普段からPython・機械学習に親しんでいる方は、よりすんなり入ってくると思います。

機械学習とは? 強化学習とは? ディープラーニングとは? といった基礎から、深層強化学習である A2C まで丁寧に書かれていて、初心者にもおすすめです!

本では Open AI Gym のゲームを例に実装が進められていますが、私は Kaggle の Connect X コンペで本に載っているいくつかの手法を試してみました。理論から実践まで記載されているので、いろんなゲームに応用することが可能だと思いました。
強化学習の何らかに行き詰まったときに解決の糸口を探すのによい本です。うまく整理されているので、すでに学んだつもりの概念の見直しにも有用です。
私はDDPGの学習が進まなくて途方に暮れてたのですが、この本の説明をもとにTD学習の実装を見直したところうまくいきました!
数式の導出や実装を勉強するのは他を当たるのがいいです。本書のDDPGの実装はkeras-rlからですし、本文にも『Policyベースの手法は学習が安定しないことが多いため、勉強以外の場合はこうしたすでにテストされた実装の使用をおすすめします』とあります。
 
   
本書の内容

ディープラーニングを学ぶなら、「仕組み」も「プログラム」もしっかり解説している本書から!

本書は、ディープラーニングの代表とも言える「畳み込みニューラルネットワーク(CNN)」を例として、その仕組みを根本から理解すること、そして、TensorFlowを用いて実際に動作するコードを動かしながら学べる書籍です。

ディープラーニングについて解説する書籍は多数発行されていますが、本書では、「きちんとニューラルネットワークの原理から理解すること」と、「その原理をどのようにコードとして書くか」の両方がバランスよく学べます。

表面的にコードを覚えるだけでは、応用力は身に付きません。本書で根本から理解しておくことで、現場に出てからも長く使える基礎力を身に付けましょう!

※本書では、プログラムの実行環境としてGoogle Colaboratoryを利用するため、面倒な環境構築は不要です。

※本書は、2016/9発行の『TensorFlowで学ぶディープラーニング入門』をもとに、Python3系、TensorFlow 2.0ベースに書き換えたほか、全体的に解説を見直し、修正しています。そのほか、実行環境をGoogle Colaboratoryに変更、オートエンコーダーによるアノマリー検知やDCGAN による画像生成などのトピックを追加しています。

(以下、本書の「はじめに」より抜粋・編集)

本書は、機械学習やデータ分析を専門とはしない、一般の方を対象とした書籍です。――と言っても、ディープラーニングの歴史や人工知能の将来展望を語る啓蒙書ではありません。ディープラーニングの代表とも言える「畳み込みニューラルネットワーク」を例として、その仕組みを根本から理解すること、そして、TensorFlowを用いて実際に動作するコードを作成することが本書の目標です。

本書は、「TensorFlowで学ぶディープラーニング」(2016/9発行)をもとにした改訂版です。サンプルコードはTensorFlow 2.0対応のKerasで書き直しています。Kerasを用いることでコードの内容はシンプルになりました。さらに、GoogleColaboratoryを用いることで難しい実行環境のセットアップも不要になりました。

さらにまた、改訂にあたり、学習後のモデルを解釈する手法、オートエンコーダによるアノマリー検知、そして、画像生成に用いられるDCGANなど、より高度な話題も内容に含めました。

本書のゴールは、コードの背後に隠された、ニューラルネートワークを構成するさまざまなパーツの動作原理を知り、ディープラーニングの本質を理解することです。

本書では、手書き文字の認識処理を行う「畳み込みニューラルネットワーク」を例として、これを構成する1つひとつのパーツの役割を丁寧に解説しています。また、Kerasを用いることで、数式を意識することなく、ニューラルネットワークを構成するコードが書けるようになりましたが、やはり、数学的な理解も欠かすことはできません。2次元平面のデータを用いた簡単な例を通して、それぞれのパーツの背後にある「数学的な仕組み」も丁寧に解説しています。

最近では、オープンソースのTensorFlow/Kerasを利用する研究者が増えることで、最先端の研究成果とも言える、さまざまなディープラーニングのモデルが実行可能なコードとして公開されるようになりました。しかしながら、コードの中身がよくわからず、自分なりの応用をしようにもどこから手をつけていいのかわからないということも多いかもしれません。そのような方は、まずは、本書を通して、Kerasを用いたコードの書き方とニューラルネットワークの動作原理を理解してください。ディープラーニングの奥深さ、そして、その面白さを味わうことは、決して専門家だけの特権ではありません。本書によって、知的探究心にあふれる皆さんが、ディープラーニングの世界へと足を踏み入れるきっかけを提供できたとすれば、筆者にとってこの上ない喜びです。

 
内容サンプル
 
User Voice
一応、初心者向けにTensorFlowについて書かれていますが、
説明が結構端折られてるので初心者には意味不明な部分が多くなると思います。

全部理解出来れば「手書き文字の認識」くらいはできるようになります。
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
※このKindle本はプリント・レプリカ形式で、Kindle Paperwhiteなどの電子書籍リーダーおよびKindle Cloud Readerではご利用いただけません。Fireなどの大きいディスプレイを備えたタブレット端末や、Kindle無料アプリ (Kindle for iOS、Kindle for Android、Kindle for PC、Kindle for Mac) でのみご利用可能です。また、文字列のハイライト、検索、辞書の参照、引用については、一部機能しない場合があります。文字だけを拡大することはできません。
※プリント・レプリカ形式は見開き表示ができません。
※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。

本当にPythonでデータマイニングと機械学習を行いたい人のための入門書
本書は,本当にPythonでデータマイニングと機械学習を行いたい人のための入門書です.
初歩からていねいに解説してあります.
本書を読み切れば,誰でもPythonによるデータマイニングと機械学習の主な手法の実装方法が身に付きます。

準備編
第1章 データマイニングと機械学習
第2章 Python速習(基本編)
第3章 Python 速習(応用編)

基礎編
第4章 回帰分析
第5章 階層型クラスタリング
第6章 非階層型クラスタリング
第7章 単純ベイズ法による分類
第8章 サポートベクトルマシン法による分類

実践編
第9章 時系列数値データの予測
第10章 日経平均株価の予測
第11章 テキストデータマイニング
第12章 Wikipedia記事の類似度
第13章 画像データの取り扱い手法
第14章 画像の類似判別とクラスタリング  
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
AI開発に必要な数学の基礎知識がこれ1冊でわかる!

【本書の目的】
本書は以下のような対象読者に向けて、
線形代数、確率、統計/微分
といった数学の基礎知識をわかりやすく解説した書籍です。

【対象読者】
数学がAIや機械学習を勉強する際の障壁になっている方
AIをビジネスで扱う必要に迫られた方
数学を改めて学び直したい方
文系の方、非エンジニアの方で数学の知識に自信のない方
コードを書きながら数学を学びたい方

【目次】
序章 イントロダクション
第1章 学習の準備をしよう
第2章 Pythonの基礎
第3章 数学の基礎
第4章 線形代数
第5章 微分
第6章 確率・統計
第7章 数学を機械学習で実践
Appendix さらに学びたい方のために

 
内容サンプル
 
User Voice
60ページにpython環境の構築とpythonの基礎。
残り220ページに三角関数、 ベクトル、行列、微分、偏微分、最急降下法、確率、相関係数、ベイズの定理、ロジスティック回帰等必要な数学を詰め込んでいます。しっかり理解するためには当然これ一冊では足りませんが、概略を掴むにはまとまっていて良いと思います。Numpyのコードがほとんどの項目についているのでnumpyに習熟するための教材としても良いと思います。
 何か機械学習や深層学習の事例があるものと思ったら全くの的はずれになります。簡単な数式のpythonによるグラフ化の例が載っているだけで、それ以降は筆者の会社の紹介があり、実装や解析はこちらへどうぞと言うだけ。
 翔泳社もよくこんな本を出版するなぁ。何でもPythonとつければ売れる時代の駄本で、わざわざ買う価値はありません。こんなことをしているから日本は取り残され遅れてゆく。情けない。
「前提として、中学程度の数学の知識があれば大丈夫です」とあるがこれが大きな間違い。

微分で解説もないまま式をのせておいて文系を対象にしてるなど書いてはいけないだろう。

また、他の方も書いているがその数式が後に何に使われるのか伝えないまま具体的イメージなく永遠と進んでいく。

翔泳社の書物全般に言えることだが、誰も中身をチェックせずに発売しているのではないだろうか?
 
   
本書の内容
 
内容サンプル
 
User Voice
 
   
本書の内容
 
内容サンプル
 
User Voice
図解が多くわかりやすいです。
数式やソースコードは出てきません。多変量解析や機械学習のアルゴリズムをざっくりと理解するのに適しています。
多変量解析の入門書に手を出して数式がさっぱりわからず詰まっていましたが、この本のおかげで他の本も読み進められるようになりました。
初学者の方はまずはこの本を読んでアルゴリズムの概要や用途を知るところから始めると良いと思います。
技術的に詳しくないのは当然としても、かといって分かり易い訳でもありません。また、言葉だけで説明が足りない、図が必ずしも適切でないものがあり消化不良を起こすのではないでしょうか。JDLA試験で言えば。E資格は慮外としてもG検定には役に立たないでしょう。初版だから仕方がないのでしょうが、いくつか間違いがあるようです。尚、G検定合格後に復習のつもりで読んだ感想です。
非常に良い本です。
 
   
本書の内容
(概要)

機械学習・ディープラーニングについて学ぶための、図解形式の解説書です。エンジニア1年生、機械学習関連企業への就職・転職を考えている人が、機械学習・ディープラーニングの基本と関連する技術、しくみ、開発の基礎知識などを一通り学ぶことができます。


(こんな方におすすめ)

・機械学習・ディープラーニングの基本を知りたい人


(目次)

1章 人工知能の基礎知識

  • 人工知能とは

  • 機械学習(ML)とは

  • ディープラーニング(DL)とは

  • 人工知能と機械学習が普及するまで

  • 2章 機械学習の基礎知識

  • 教師あり学習のしくみ

  • 教師なし学習のしくみ

  • 強化学習のしくみ

  • 統計と機械学習の違い

  • 機械学習と特徴量

  • 得意な分野、苦手な分野

  • 機械学習の活用事例

  • 3章 機械学習のプロセスとコア技術

  • 機械学習の基本ワークフロー

  • データの収集

  • データの整形

  • モデルの作成と学習

  • バッチ学習とオンライン学習

  • テストデータによる予測結果の検証

  • 学習結果に対する評価基準

  • ハイパーパラメータとモデルのチューニング

  • 能動学習

  • 相関と因果

  • フィードバックループ

  • 4章 機械学習のアルゴリズム

  • 回帰分析

  • サポートベクターマシン

  • 決定木

  • アンサンブル学習

  • アンサンブル学習の応用

  • ロジスティック回帰

  • ベイジアンモデル

  • 時系列分析と状態空間モデル

  • k近傍(k-NN) 法とk平均(k-means)法

  • 次元削減と主成分分析

  • 最適化と遺伝的アルゴリズム

  • 5章 ディープラーニングの基礎知識

  • ニューラルネットワークとその歴史

  • ディープラーニングと画像認識

  • ディープラーニングと自然言語処理

  • 6章 ディープラーニングのプロセスとコア技術

  • 誤差逆伝播法によるニューラルネットワークの学習

  • ニューラルネットワークの最適化

  • 勾配消失問題

  • 転移学習

  • 7章 ディープラーニングのアルゴリズム

  • 畳み込みニューラルネットワーク(CNN)

  • 再帰型ニューラルネットワーク(RNN)

  • 強化学習とディープラーニング

  • オートエンコーダ

  • GAN(敵対的生成ネットワーク)

  • 物体検出

  • 8章 システム開発と開発環境

  • 人工知能プログラミングにおける主要言語

  • 機械学習用ライブラリとフレームワーク

  • ディープラーニングのフレームワーク

  • GPUプログラミングと高速化

  • 機械学習サービス
  •  
    内容サンプル
     
    User Voice
    図解が多くわかりやすいです。
    数式やソースコードは出てきません。多変量解析や機械学習のアルゴリズムをざっくりと理解するのに適しています。
    多変量解析の入門書に手を出して数式がさっぱりわからず詰まっていましたが、この本のおかげで他の本も読み進められるようになりました。
    初学者の方はまずはこの本を読んでアルゴリズムの概要や用途を知るところから始めると良いと思います。
    技術的に詳しくないのは当然としても、かといって分かり易い訳でもありません。また、言葉だけで説明が足りない、図が必ずしも適切でないものがあり消化不良を起こすのではないでしょうか。JDLA試験で言えば。E資格は慮外としてもG検定には役に立たないでしょう。初版だから仕方がないのでしょうが、いくつか間違いがあるようです。尚、G検定合格後に復習のつもりで読んだ感想です。
    非常に良い本です。
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    ※この商品は固定レイアウト型の電子書籍です。
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。
    ※お使いの端末で無料サンプルをお試しいただいた上でのご購入をお願いいたします。

    ※本書内容はカラー(2色)で制作されているため、カラー表示可能な端末での閲覧を推奨いたします。


    数学がニガテでも大丈夫! 今度はディープラーニングをやさしく学ぼう

    「ディープラーニングをライブラリで実装できるけれど、よく意味が分かっていない」
    「ディープラーニングの背景にある数式を理解して、何が行われているか知っておきたい」

    本書はそんな人のための本です。
    勉強中のプログラマ「アヤノ」と、友達の「ミオ」の会話を通じて、ディープラーニングでどんなふうに入力値から出力値までの計算がされているのか、楽しく学んでいきます。

    ※本書は『やさしく学ぶ 機械学習を理解するための数学のきほん』の続刊となりますが、前作を読んでいない人でも問題なく読むことができます。


    本書では、

    ・ニューラルネットワークでは何ができるのか
    ・単層のパーセプトロンではどのような計算が行われているのか
    ・パーセプトロンではどうやって問題を解いているのか
    ・パーセプトロンにはどんな欠点があるのか

    などの基本的な部分から解説を始めます。
    パーセプトロンが理解できたら、続いて多層のニューラルネットワークについて学んでいきます。

    ・ニューラルネットワークではどうやって問題を解いているのか
    ・問題を正しく解くためのパラメーターはどうやって学習しているのか

    といったことについて、1つずつ数式を理解して、時には具体的な数値を当てはめて実際に計算しながら理解していきます。

    ニューラルネットワークが理解できたら、いよいよ画像の分類などに向いている「畳み込みニューラルネットワーク」について学習を進めます。

    何をやっているのか、図解と数式で確認しつつ学習し、どのようにして「畳み込みニューラルネットワーク」が分類のタスクを行っているのか丁寧に解説します。

    そして最後の章では、ここまでの章で学習した数式をもとに、Pythonでプログラムを書いていきます。ライブラリとしてはNumPyだけを使用し、学習した数式を振り返りながらプログラムを書いていきます。ディープラーニング用のライブラリでは数行で書ける部分ですが、1行1行理解しながら動かしていくことで、理解を深めることができます。


    【各章の概要】

    Chapter1 ニューラルネットワークを始めよう

    ニューラルネットワークがどんな構造をしていて、どういうことができるのかについて、図や簡単な数式を使って解説します。

    Chapter2 順伝播を学ぼう

    パーセプトロンというニューラルネットワークを構成する小さなアルゴリズムについて、どんな風に計算が行われるかを解説します。


    Chapter3 逆伝播を学ぼう

    ニューラルネットワークで、適切な重みとバイアスをどのように計算して求めればよいかについて説明します。

    Chapter4 畳み込みニューラルネットワークを学ぼう

    畳み込みニューラルネットワーク特有の仕組みや計算を取り上げながら、重みとバイアスの更新方法まで説明します。


    Chapter5 ニューラルネットワークを実装しよう

    ここまでの章で学んだニューラルネットワークの計算方法を踏まえ、Pythonでプログラミングしていきます。


    Appendix

    Chapter1からChapter5までには入りきらなかった数学の知識と、環境構築、PythonとNumPyの簡単な説明を入れています。

    総和の記号/微分/偏微分/合成関数/ベクトルと行列/指数・対数/Python環境構築/Pythonの基本/NumPyの基本


    ●著者
    立石 賢吾(たていし けんご)

    スマートニュース株式会社 機械学習エンジニア。
    佐賀大学卒業後にいくつかの開発会社を経て、2014年にLINE Fukuoka株式会社へ入社。同社にてデータ分析及び機械学習を専門とする組織を福岡で立ち上げ、レコメンドやテキスト分類など機械学習を使ったプロダクトを担当。同組織の室長を経て2019年にスマートニュース株式会社へ入社、以後機械学習エンジニアとして現職に従事。  
    内容サンプル
     
    User Voice
    参考書探しの一環として本書を購入しましたが、初心者向けの参考書としては良い本でした。
    コラムには普通の本ではあまり書かれていない様なこと(何故ニューラルネットワークでは線形性を持つ関数が用いられないのか など)も書かれています。
    ただ、初心者が独学で理解するためには多少の根気が必要だと思います。特に誤差逆伝播法~畳み込みニューラルネットワークの説明は、数学アレルギーの方が読むと蕁麻疹が出てしまうかもしれません。
    「アヤノ」は数学が分からないということになっていますが騙されてはいけません。地頭がとんでもなく良いので、大量の添え字を使った複雑な式もスラスラ理解していきます。
    その点で星4としました。
    前作も買って読んだことがありますが、この本も同じように会話形式で話が進んでいきます。
    数式がたくさん出てきますが、個人的には数学は嫌いではないので特に拒絶反応もでずに、かつ説明がとてもわかりやすかったので、サラッと読み進めることができました。各章毎にコラムという枠が設けてあり、ディープラーニングに関するトリビアや補填などが書かれていて、私はこれが面白かったです。

    数学に関して右も左も分からないような方には難しいかもしれませんが、私のような機械学習やディープラーニングに興味のあるエンジニアにはぴったりかと思います。
    私は今まで色々な本で機械学習やディープラーニングの勉強をしていましたが、細かく数学を追うことはしていませんでした。この本では数学の部分(誤差逆伝搬など)をとても丁寧に書いており、今までふわっと理解していた基礎部分がしっかりと固められた気がします。また個人的にはコラムの内容(勾配消失する理由や交差エントロピーって何?的な)も面白くて好きでした。数式だけではなく最終章で実際にPythonを使った実装も行うので、理解を深めるにはとても良いと思いました!
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
    基本的なニューラルネットワークの作り方だけではなく、最新技術(GANを用いた異常検知など)についての実装の方法が書いてあり、物体検出、自然言語処理など幅広い範囲まで網羅されています。
    さらには、その手法がどんなものなのかの解説がかなり詳しく書いてあり、学生でも読んでいて分かりやすい内容になっています。
    そのコードがgithubにあるのもなお良いです。

    PyTorchプログラマー向けの書籍の中では、文句なしの100点です。
    ゼロから作るDeep learningを一通り読了し、自力でのモデル作成等を試した後、高度な機械学習を求めてpytorchとこの本にたどり着いた。
    発展と名のついているように、手取り足取り教えてくれる本ではない。PyTorch学習用として購入したが、使い方の記述は最小限に抑えられている。また、PIL、numpy、torchvisionなどのライブラリも使用されているが、これらの説明がされることもないので、ネットで調べながら学習することは必須。
    ただし、内容自体はレベルが高いように感じる。入門書では知ることのなかった転移学習やデータオーギュメンテーションなど、有用なコンセプトが序盤から頻発している。ただし、説明自体はあっさりしているので、本書の恩恵を十全に受けたいなら読者にも相応の力量が求められると思う。

    個人的には学習段階にある程度マッチしていたので良書となったが、機械学習の一冊目として購入していたなら挫折していただろう。一通り機械学習を学び次のステップを踏みたい(そしてそのステップをPyTorchで踏みたい)人であれば本書は非常にお勧めできます。
    最新のアルゴリズムが、分かりやすく説明されています。サイトだけだと、なかなか理解できなかったものが、頭にす~と入ってきます。
     
       
    本書の内容
    ※この商品は固定レイアウト型の電子書籍です。
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。
    ※お使いの端末で無料サンプルをお試しいただいた上でのご購入をお願いいたします。
    ※本書内容はカラーで制作されているページがございますため、カラー表示可能な端末での閲覧を推奨いたします。


    ディープラーニングの発展・応用手法を実装しながら学ぼう

    本書ではディープラーニングの発展・応用手法を実装しながら学習していきます。ディープラーニングの実装パッケージとしてPyTorchを利用します。扱うタスク内容とディープラーニングモデルは次の通りで「ビジネスの現場でディープラーニングを活用するためにも実装経験を積んでおきたいタスク」という観点で選定しました。

    [本書で学習できるタスク]
    転移学習、ファインチューニング:少量の画像データからディープラーニングモデルを構築
    物体検出(SSD):画像のどこに何が映っているのかを検出
    セマンティックセグメンテーション(PSPNet):ピクセルレベルで画像内の物体を検出
    姿勢推定(OpenPose):人物を検出し人体の各部位を同定しリンク
    GAN(DCGAN、Self-Attention GAN):現実に存在するような画像を生成
    異常検知(AnoGAN、Efficient GAN):正常画像のみからGANで異常画像を検出
    自然言語処理(Transformer、BERT):テキストデータの感情分析を実施
    動画分類(3DCNN、ECO):人物動作の動画データをクラス分類

    本書は第1章から順番に様々なタスクに対するディープラーニングモデルの実装に取り組むことで高度かつ応用的な手法が徐々に身につく構成となっています。各ディープラーニングモデルは執筆時点でState-of-the-Art(最高性能モデル)の土台となっており、実装できるようになればその後の研究・開発に役立つことでしょう。
    ディープラーニングの発展・応用手法を楽しく学んでいただければ幸いです。


    実装環境
    ・読者のPC(GPU環境不要)、AnacondaとJupyter Notebook、AWSを使用したGPUサーバー
    ・AWSの環境:p2.xlargeインスタンス、Deep Learning AMI(Ubuntu)マシンイメージ(OS Ubuntu 16.04|64ビット、NVIDIA K80 GPU、Python 3.6.5、conda 4.5.2、PyTorch 1.0.1)

    ●目次
    第1章 画像分類と転移学習(VGG)
    第2章 物体認識(SSD)
    第3章 セマンティックセグメンテーション(PSPNet)
    第4章 姿勢推定(OpenPose)
    第5章 GANによる画像生成(DCGAN、Self-Attention GAN)
    第6章 GANによる異常検知(AnoGAN、Efficient GAN)
    第7章 自然言語処理による感情分析(Transformer)
    第8章 自然言語処理による感情分析(BERT)
    第9章 動画分類(3DCNN、ECO)


    ●著者
    小川 雄太郎
    SIerの技術本部・開発技術部に所属。ディープラーニングをはじめとした機械学習関連技術の研究開発・技術支援を業務とする。明石工業高等専門学校、東京大学工学部を経て、東京大学大学院、神保・小谷研究室にて脳機能計測および計算論的神経科学の研究に従事し、2016年に博士号(科学)を取得。東京大学特任研究員を経て、2017年4月より現職。本書の他に、「つくりながら学ぶ! 深層強化学習 -PyTorchによる実践プログラミング-」(マイナビ出版、2018年6月)なども執筆。  
    内容サンプル
     
    User Voice
    基本的なニューラルネットワークの作り方だけではなく、最新技術(GANを用いた異常検知など)についての実装の方法が書いてあり、物体検出、自然言語処理など幅広い範囲まで網羅されています。
    さらには、その手法がどんなものなのかの解説がかなり詳しく書いてあり、学生でも読んでいて分かりやすい内容になっています。
    そのコードがgithubにあるのもなお良いです。

    PyTorchプログラマー向けの書籍の中では、文句なしの100点です。
    ゼロから作るDeep learningを一通り読了し、自力でのモデル作成等を試した後、高度な機械学習を求めてpytorchとこの本にたどり着いた。
    発展と名のついているように、手取り足取り教えてくれる本ではない。PyTorch学習用として購入したが、使い方の記述は最小限に抑えられている。また、PIL、numpy、torchvisionなどのライブラリも使用されているが、これらの説明がされることもないので、ネットで調べながら学習することは必須。
    ただし、内容自体はレベルが高いように感じる。入門書では知ることのなかった転移学習やデータオーギュメンテーションなど、有用なコンセプトが序盤から頻発している。ただし、説明自体はあっさりしているので、本書の恩恵を十全に受けたいなら読者にも相応の力量が求められると思う。

    個人的には学習段階にある程度マッチしていたので良書となったが、機械学習の一冊目として購入していたなら挫折していただろう。一通り機械学習を学び次のステップを踏みたい(そしてそのステップをPyTorchで踏みたい)人であれば本書は非常にお勧めできます。
    最新のアルゴリズムが、分かりやすく説明されています。サイトだけだと、なかなか理解できなかったものが、頭にす~と入ってきます。
     
       
    本書の内容
    私たちの日常生活で、人工知能が普通に使われる時代になりました。スマートフォンの顔認証、自動運転技術、SiriやAlexaのようなAI音声アシスタントなど身近な技術ばかりです。これからは機械学習や深層学習はエンジニアの基本教養となるかもしれません。本書は、機械学習や深層学習の分野から画像認識に重点をおいて、難しい数式をつかわず、図や写真を多用して解説する入門書です。必要な概念、用語、キーワードも網羅的に説明します。

    ※この商品は固定レイアウトで作成されており、タブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。  
    内容サンプル
     
    User Voice
    書名のとおり特には画像認識処理に的が絞られていますが、分かりやすい解説がされているのでPython用の深層学習システムの入門書としてお勧めです。

    特に畳み込みがどういった計算なのかを具体的な値を使って実際に計算する解説が非常に分かりやすいのでこの部分だけでも読む価値はあるかと思います(p.53以降)。
    但し(意味は問題なく通じますが)p.56中段の「行列」が何を指しているのか不明(githubのこの本の誤記の訂正にも特に説明が無いようです)なのと、p.53下段の「行列の掛け算」は普通の行列の積と間違われそうなので言い方を変えた方が良い気がします
    畳み込みの計算で行っているのはカーネル(フィルタ)行列と入力データが重なった位置にある要素同士を掛けたものの合計で、この掛け算の仕方は専門用語でアダマール積と言うようです。

    ちなみにこの本はChainerが出てくる珍しい本ですが、第2版を出す場合にはPyTorchに書き直す必要がありそうです。
    普段ウェブサービスを開発しているエンジニアですが、機械学習と深層学習に興味があり書籍を購入しました。
    Pythonなども初めて触れたのですが、環境構築からエラーなくとてもスムーズに学ぶことができました。
    新規プロジェクトでPythonを利用したデータ解析部分がありこの本がとても役に立ちました。
    これから機械学習を学ぶ人にとってはとてもオススメの本だと思います。
    興味深い内容だった。
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    きれいに整形されたデータを使った分析の経験はあっても、「実務で扱う生データをどのように前処理すればよいのか」と、お悩みではないでしょうか。前処理は課題ごとに、都度オーダーメイドで設計・実装していくものです。本書では4種類のデータを対象とし、機械学習で予測を行う場合の前処理の基本ノウハウを学び、Pythonによる実装を体験します。本書で扱った技術は、そのまま実務にも活かせます。
     機械学習における分析モデルの作成は自動化されつつありますが、その時に投入する特徴量は、人の手で前処理して作成する状況が続くでしょう。これからデータ分析に携わる方々にとって、前処理の力を高めることは、きっと大きな助けとなるでしょう。
    (本書「あとがき」から抜粋・編集)

    ■著者プロフィール

    足立 悠(あだち はるか)

    BULB株式会社所属のデータサイエンティスト。
    過去にメーカーのSE やデータサイエンティスト、IT ベンダーのデータアナリスト等を経て現職。数々のデータ分析プロジェクトのほか、実務者教育にも従事。個人的な活動として、記事や書籍の執筆、セミナー講師なども行っている。著書に『初めてのTensorFlow』と『ソニー開発のNeural Network Console 入門』がある。
    多感な時期に高専で5年間を過ごしてしまったせいか、周囲から変人や外れ値と評されている。趣味はお地蔵さんが密集している場所に佇むこと。近いうちに、日本を北から南へ移動しながら仕事し、パフォーマンスを測定してみたい。  
    内容サンプル
     
    User Voice
    大雑把に「構造化」「画像」「時系列」「自然言語」データの前処理について扱っている.
    そのレベルは入門者向けで,もしこれらのデータ処理に少しでも手を付けたことがあるならば,その分野においてこの本から新たな知見が得られることはほとんどないように思う.私は画像・時系列データに触れたことが多少ある程度であるが,これらの章から新たなものを得ることはなかった.一方で,扱ったことのない構造化・自然言語については,「なるほど,こんな感じでやるのか」というぼんやりとではあるが方向性をつかめた気がする.そういった意味で,もしデータ処理の経験が皆無に近いのであれば,どのような手順で処理を進めれば良いかを学ぶことができるかもしれない.
    プログラミングとしてはPythonで行ない,開発環境をクラウドサービスを用いる方法を紹介している.まっさらな状態で,とりあえず手を動かして機械学習というものに触れてみたいという人でも,内容をなぞっていくのは問題ないと思われる.
    機械学習のアルゴリズムにはさわりだけ触れて,あとは既存のパッケージを利用して話を進めている.アルゴリズムについても勉強したいという人には,本書は適切ではない.その点にあまり関心がなく,機械学習をツールとして使いたいというだけの人であれば問題ないだろう.

    タイトルに書いたように,「とりあえず手を動かしてみたい入門者」であれば本書を通じて何かを得ることはできると思う.すでになんらかの機械学習に手を付けていて,その上で「前処理」についてしっかりと学びたい人にはお勧めできない.
    仕事でAIをやっていますが非常に参考になりました。データ前処理の基本的なテクニックを学ぶことができました。学習した内容をもとにステップアップしたいと思います。
    機械学習はやっぱり前処理でしょう。
     
       
    本書の内容
    近年、企業が円滑にビジネスを進める上で取り扱うデータ量は急増し、本格的なビッグデータ時代の到来がさけばれています。それに伴い、これらビックデータを分析しビジネスに活用するデータサイエンティストの需要も高まっており、各企業では、データサイエンティストの育成に力を入れたり、高額な給与で採用したりと、人材不足に対応する動きが盛んになってきています。

    データサイエンティストに欠かせないスキルの1つが、データ分析、ディープラーニング、機械学習などに必要となるプログラミングのスキルです。その中でも、Python(パイソン)に関する知識は必要不可欠となります。

    Python(パイソン)は、直観的で非常にわかりやすいプログラミング言語で、シンプルに記述することができ、初心者でも大変学びやすい言語です。

    また、たくさんのライブラリと呼ばれる再利用可能なプログラムが公開されていて、これらのライブラリを使って、比較的簡単に高度な機能を実現することができます。AIに関連するライブラリも数多くあり、機械学習、ディーブラーニングやデータ分析の分野でも広く使われています。

    Pythonの開発環境だけで無く、これらの非常に便利なライブラリがインターネット上で無料で提供されており、費用をかけずに始めることができます。

    この本では、今後データサイエンスや機械学習、AIを学習していきたいと考えている方へ向けて、それらの知識の習得に欠かせないPythonの基本的なトピックに重点を絞り、チュートリアル形式で解説していきます。プログラミング未経験者や初心者でもわかりやすいよう、丁寧に解説していきます。特にPythonでデータ分析・AI・機械学習を学ぶ上で欠かせない基礎となる重要な事項を取り上げています。


    【 目次 】
    第1章. 環境準備
    この章では、Pythonを始めるにあたって欠かすことのできない、環境構築の方法について、初心者でもわかりやすいよう、1つ1つの手順を追って、丁寧に説明しています。是非この記事を元にPythonの開発環境を準備し、プログラミングにチャレンジしてください。

    第2章. 基本操作
    第1章で準備した開発環境について、今後の章の理解に必要となる基本的な操作の説明をしています。

    第3章. 変数
    最初に基本となるPythonの変数の宣言や変数名のルールを説明しています。変数とは何か?という説明から、具体的な例を用いて使い方の説明など、初心者にもわかりやすいよう丁寧な解説を心がけています。

    第4章. データ型
    次にPythonに用意されているデータ型の種類とその確認方法を説明しています。

    第5章. 数値計算(四則演算)
    Pythonでは、数値は四則演算を行うことができるように演算子が用意されています。Pythonに用意されている基本的な四則演算を行うための演算子を確認していきましょう。

    第6章. Print関数
    画面にメッセージを表示したり、記述したプログラムが正常に動作するか確認する際に、変数などに格納された値を画面に出力するのに必要なprint関数についての解説です。

    第7章. リスト(List)
    Pythonにおけるリスト(配列)の使い方に関する記事です。リストとは何か?その特徴は?という基本的な説明から始まり、リストへの要素の追加の方法や、追加した要素の変更、削除方法、また検索方法について説明しています。

    第8章. タプル(Tuple)
    タプルは読み取り専用のリストのようなものです。タプルについても定義の仕方や検索方法について解説していきます。

    第9章. ディクショナリ(Dictionary)
    Pythonには、キーと紐付けて値を登録することで、取り出しやすいかたちでデータを格納することができるDictionary(辞書)というものがあり、特徴や使い方を取り上げています。

    第10章. 条件分岐(IF文)
    この章では、Pythonにおける条件分岐(If文)の記述方法や注意点について見ていきます。

    第11章. 繰り返し処理(For文)
    Pythonの繰り返し処理の1つであるFor文の書き方や使い方の例を取り上げています。

    第12章. 繰り返し処理(While文)
    Pythonの繰り返し処理にはWhile文もあり、For文との違いやWhile文の使い方を説明しています。

    第13章. コメント
    プログラムに関する注釈であるコメントについての書き方や、規約・ルールの例、便利な表示方法について解説しています。

    第14章. 関数
    何度も繰り返し利用する処理は、関数と呼ばれる一連の命令として定義しておくと、同じコードを記述する必要が無く、関数を呼び出すだけで良いので非常に便利です。ここでは、関数の記述方法や呼び出し方について説明しています。

    第15章. モジュール、パッケージ、ライブラリ
    Pythonでは、科学技術計算でよく使われるNumPy(ナンパイ)やグラフ描画に使われるMatplotlib(マットプロットリブ)、データ解析を支援する機能を提供するPandas(パンダス)など、多くの便利な機能がライブラリという形で提供されます。これらのインストール方法や利用するのに必要な基礎知識について説明しています。

    第16章. NumPyでベクトル・行列計算
    NumPy(ナンパイ)は、ベクトルや行列などを効率的に数値計算するための数学関数ライブラリを提供します。ここでは次のようなトピックについて解説していきます。
    ・NumPyでのベクトル、行列の作成方法
    ・連続した配列の自動作成
    ・ランダムな数値を含む配列の自動作成
    ・NumPyでの行列の計算方法
    ・NumPyでの配列のインデックス
    ・NumPyでの配列の更新
    ・NumPyの数値計算用関数
    ・whereで条件に応じたデータを抽出
    ・NumPyでのファイル操作関数

    第17章. Matplotlibでグラフの描画
    Pythonのグラフの描画に欠かせないのが、Matplotlib(マットプロットリブ)になります。Matplotlibは、Pythonのグラフ描画用ライブラリで、様々なグラフを作成し、データを可視化することができます。この章では、Matplotlibで折れ線グラフ、棒グラフ、円グラフ、散布図など各種グラフの描画方法を解説していきます。

    第18章. Pandasでデータ分析
    Pandas(パンダス)とは、データを効率的に扱うために開発されたPythonのライブラリの1つで、データ分析、機械学習、ディープラーニングには必要不可欠なものになります。ここでは次のようなトピックについて説明していきます。
    ・Seriesの基本(作成、参照、要素の追加、削除、インデックスなど)
    ・DataFrameの基本(作成、参照、要素の追加、削除、インデックスなど)
    ・DataFrameへのインデックス追加と削除
    ・DataFrameのソート(インデックス、列名、指定した値)
    ・DataFrameの参照(単一インデックス)
    ・DataFrameの参照(階層型インデックス)
    ・DataFrameから条件指定でのデータ抽出
    ・Excel、CSVファイルの読み込み、書き込み
    ・DataFrameの結合(Union)
    ・DataFrameの結合(Join)
    ・ピボットテーブルの作成
    ・時系列データの分析

    [文字数 / ページ数]
    約60,250 / 約310ページ


    [著者紹介]
    清水 義孝 (しみず・よしたか)
    データサイエンティスト
    1973年生まれ。
    小学生の頃からプログラミングに興味を持ち、MSXでベーシックを習得し、ゲームの自作に夢中になる。

    大学卒業後は、某大手IT企業でシステムエンジニアとして、数々のデータウェアハウス、データ分析基盤の導入に携わる。その中で、データ分析に興味を持ち始め、データ分析には、ITの知識、スキルだけでなく、ビジネスに関する深い知識やスキルが必要だと感じる。

    論理・仮説思考力、統計・定量分析、プレゼンなどのスキル、ファイナンス・マーケティングなどのビジネスの知識を習得すべく、海外のビジネススクールに通いMBA(経営学修士)取得。

    その後、某大手製造業でデータサイエンティストとして、ビックデータの分析に携わる。
    データ分析、プログラミングに関して、初心者に役立つ情報を発信すべく、2018年よりWebサイト「Pythonで学ぶデータ分析・AI・機械学習」( https://ai-inter1.com/ )の運営を始める。
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    ◇-------------------------------------------◇
    実践的な基礎が学習しやすい!!
    ◇-------------------------------------------◇

    注目を集めるPython(パイソン)を使った機械学習の、
    実践的な基礎が学べる解説書です。

    小さいサンプルプログラム(bot)に機能を追加しながら
    データ収集から前処理、学習、予測、評価まで
    周辺技術も含めた機械学習の全体像が学べます。

    本書のサンプルプログラムは、
    すべて本書のサポートページからダウンロードできます。

    ■本書はこんな人におすすめ
    ・Pythonの入門書を読み終えた人
    ・Pythonを使った機械学習に触れてみたい人
    ・業務で役立つ実践的なノウハウが知りたい人
    など

    ■本書の内容
    Chapter 1 機械学習について知ろう
    Chapter 2 環境を準備しよう
    Chapter 3 スクレイピングでデータ収集をしよう
    Chapter 4 日本語の文章生成をしよう
    Chapter 5 手書き文字認識をしよう
    Chapter 6 データの前処理を学ぼう
    Chapter 7 回帰分析をしよう
    Chapter 8 機械学習の次のステップ
     
    内容サンプル
     
    User Voice
    人工知能のシステム開発に関する基本的な情報、知識の習得に大変役に立ちそうで満足しています。
     機械学習のための前処理(スクレイピング、Pandas等)を中心に、ポイントを絞って丁寧に説明されています。サンプルプログラムも短めにしてあり、読みやすい本だと思います。DeepLearningについては触れていませんが、日本語処理、Webアプリへの組み込みなどについて簡単な例を学ぶことができます。実践に結びつけるための最初のとっかかりとしてベストな本のひとつだと思います。
    教師有りのサンプルしかない。教師無し、強化学習のサンプルがない。スクレイピングの説明のボリュームが多く、肝心の回帰分析や未来予測の説明がすくない、もしくはない。全体的にわかりやすいけど偏った内容
     
       
    本書の内容
    よくわかるPython3入門④Pandasでデータ分析編 - データ分析・機械学習に欠かせない基本をマスターしよう

    本書は「よくわかるPython3入門」シリーズの第4弾で、ビジネスにおけるデータ分析によく使われるPandasというライブラリを解説したものになります。

    「よくわかるPython3入門」シリーズの第1弾の基礎編をまだご覧になられておられない方は、そちらから始められることをお勧めします。
    http://www.amazon.co.jp/dp/B07SRLDGGR

    近年、企業が円滑にビジネスを進める上で取り扱うデータ量は急増し、本格的なビッグデータ時代の到来がさけばれています。それに伴い、これらビックデータを分析しビジネスに活用するデータサイエンティストの需要も高まっており、各企業では、データサイエンティストの育成に力を入れたり、高額な給与で採用したりと、人材不足に対応する動きが盛んになってきています。

    データサイエンティストに欠かせないスキルの1つが、データ分析、ディープラーニング、機械学習などに必要となるプログラミングのスキルです。その中でも、Python(パイソン)に関する知識は必要不可欠となります。

    Python(パイソン)は、直観的で非常にわかりやすいプログラミング言語で、シンプルに記述することができ、初心者でも大変学びやすい言語です。

    また、たくさんのライブラリと呼ばれる再利用可能なプログラムが公開されていて、これらのライブラリを使って、比較的簡単に高度な機能を実現することができます。AIに関連するライブラリも数多くあり、機械学習、ディーブラーニングやデータ分析の分野でも広く使われています。

    Pythonの開発環境だけで無く、これらの非常に便利なライブラリがインターネット上で無料で提供されており、費用をかけずに始めることができます。

    この本では、今後データサイエンスや機械学習、AIを学習していきたいと考えている方へ向けて、それらの知識の習得に欠かせないPythonの基本的なトピックに重点を絞り、チュートリアル形式で解説していきます。プログラミング未経験者や初心者でもわかりやすいよう、丁寧に解説していきます。特にPythonでデータ分析・AI・機械学習を学ぶ上で欠かせない基礎となる重要な事項を取り上げています。


    【 目次 】
    第1章. 環境準備
    この章では、Pythonを始めるにあたって欠かすことのできない、環境構築の方法について、初心者でもわかりやすいよう、1つ1つの手順を追って、丁寧に説明しています。是非この記事を元にPythonの開発環境を準備し、プログラミングにチャレンジしてください。

    第2章. 基本操作
    第1章で準備した開発環境について、今後の章の理解に必要となる基本的な操作の説明をしています。

    第3章. Pandasでデータ分析
    Pandas(パンダス)とは、データを効率的に扱うために開発されたPythonのライブラリの1つで、データ分析、機械学習、ディープラーニングには必要不可欠なものになります。ここでは次のようなトピックについて説明していきます。
    ・Seriesの基本(作成、参照、要素の追加、削除、インデックスなど)
    ・DataFrameの基本(作成、参照、要素の追加、削除、インデックスなど)
    ・DataFrameへのインデックス追加と削除
    ・DataFrameのソート(インデックス、列名、指定した値)
    ・DataFrameの参照(単一インデックス)
    ・DataFrameの参照(階層型インデックス)
    ・DataFrameから条件指定でのデータ抽出
    ・Excel、CSVファイルの読み込み、書き込み
    ・DataFrameの結合(Union)
    ・DataFrameの結合(Join)
    ・ピボットテーブルの作成
    ・時系列データの分析

    [文字数 / ページ数]
    約29,700 / 約170ページ


    [著者紹介]
    清水 義孝 (しみず・よしたか)
    データサイエンティスト
    1973年生まれ。
    小学生の頃からプログラミングに興味を持ち、MSXでベーシックを習得し、ゲームの自作に夢中になる。

    大学卒業後は、某大手IT企業でシステムエンジニアとして、数々のデータウェアハウス、データ分析基盤の導入に携わる。その中で、データ分析に興味を持ち始め、データ分析には、ITの知識、スキルだけでなく、ビジネスに関する深い知識やスキルが必要だと感じる。

    論理・仮説思考力、統計・定量分析、プレゼンなどのスキル、ファイナンス・マーケティングなどのビジネスの知識を習得すべく、海外のビジネススクールに通いMBA(経営学修士)取得。

    その後、某大手製造業でデータサイエンティストとして、ビックデータの分析に携わる。
    データ分析、プログラミングに関して、初心者に役立つ情報を発信すべく、2018年よりWebサイト「Pythonで学ぶデータ分析・AI・機械学習」( https://ai-inter1.com/ )の運営を始める。
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    よくわかるPython3入門⑤総集編 - データ分析・機械学習に欠かせない基本をマスターしよう

    本書は「よくわかるPython3入門」シリーズの第5弾で、第1弾から第4弾の内容を全て合わせたものとなります。

    第1弾で解説したPythonの基礎と合わせて、科学技術計算でよく使われるNumPy(ナンパイ)やグラフ描画に使われるMatplotlib(マットプロットリブ)というライブラリ、さらにデータ分析によく用いられるPandas(パンダス)というライブラリを解説したものになります。

    近年、企業が円滑にビジネスを進める上で取り扱うデータ量は急増し、本格的なビッグデータ時代の到来がさけばれています。それに伴い、これらビックデータを分析しビジネスに活用するデータサイエンティストの需要も高まっており、各企業では、データサイエンティストの育成に力を入れたり、高額な給与で採用したりと、人材不足に対応する動きが盛んになってきています。

    データサイエンティストに欠かせないスキルの1つが、データ分析、ディープラーニング、機械学習などに必要となるプログラミングのスキルです。その中でも、Python(パイソン)に関する知識は必要不可欠となります。

    Python(パイソン)は、直観的で非常にわかりやすいプログラミング言語で、シンプルに記述することができ、初心者でも大変学びやすい言語です。

    また、たくさんのライブラリと呼ばれる再利用可能なプログラムが公開されていて、これらのライブラリを使って、比較的簡単に高度な機能を実現することができます。AIに関連するライブラリも数多くあり、機械学習、ディーブラーニングやデータ分析の分野でも広く使われています。

    Pythonの開発環境だけで無く、これらの非常に便利なライブラリがインターネット上で無料で提供されており、費用をかけずに始めることができます。

    この本では、今後データサイエンスや機械学習、AIを学習していきたいと考えている方へ向けて、それらの知識の習得に欠かせないPythonの基本的なトピックに重点を絞り、チュートリアル形式で解説していきます。プログラミング未経験者や初心者でもわかりやすいよう、丁寧に解説していきます。特にPythonでデータ分析・AI・機械学習を学ぶ上で欠かせない基礎となる重要な事項を取り上げています。


    【 目次 】
    第1章. 環境準備
    この章では、Pythonを始めるにあたって欠かすことのできない、環境構築の方法について、初心者でもわかりやすいよう、1つ1つの手順を追って、丁寧に説明しています。是非この記事を元にPythonの開発環境を準備し、プログラミングにチャレンジしてください。

    第2章. 基本操作
    第1章で準備した開発環境について、今後の章の理解に必要となる基本的な操作の説明をしています。

    第3章. 変数
    最初に基本となるPythonの変数の宣言や変数名のルールを説明しています。変数とは何か?という説明から、具体的な例を用いて使い方の説明など、初心者にもわかりやすいよう丁寧な解説を心がけています。

    第4章. データ型
    次にPythonに用意されているデータ型の種類とその確認方法を説明しています。

    第5章. 数値計算(四則演算)
    Pythonでは、数値は四則演算を行うことができるように演算子が用意されています。Pythonに用意されている基本的な四則演算を行うための演算子を確認していきましょう。

    第6章. Print関数
    画面にメッセージを表示したり、記述したプログラムが正常に動作するか確認する際に、変数などに格納された値を画面に出力するのに必要なprint関数についての解説です。

    第7章. リスト(List)
    Pythonにおけるリスト(配列)の使い方に関する記事です。リストとは何か?その特徴は?という基本的な説明から始まり、リストへの要素の追加の方法や、追加した要素の変更、削除方法、また検索方法について説明しています。

    第8章. タプル(Tuple)
    タプルは読み取り専用のリストのようなものです。タプルについても定義の仕方や検索方法について解説していきます。

    第9章. ディクショナリ(Dictionary)
    Pythonには、キーと紐付けて値を登録することで、取り出しやすいかたちでデータを格納することができるDictionary(辞書)というものがあり、特徴や使い方を取り上げています。

    第10章. 条件分岐(IF文)
    この章では、Pythonにおける条件分岐(If文)の記述方法や注意点について見ていきます。

    第11章. 繰り返し処理(For文)
    Pythonの繰り返し処理の1つであるFor文の書き方や使い方の例を取り上げています。

    第12章. 繰り返し処理(While文)
    Pythonの繰り返し処理にはWhile文もあり、For文との違いやWhile文の使い方を説明しています。

    第13章. コメント
    プログラムに関する注釈であるコメントについての書き方や、規約・ルールの例、便利な表示方法について解説しています。

    第14章. 関数
    何度も繰り返し利用する処理は、関数と呼ばれる一連の命令として定義しておくと、同じコードを記述する必要が無く、関数を呼び出すだけで良いので非常に便利です。ここでは、関数の記述方法や呼び出し方について説明しています。

    第15章. モジュール、パッケージ、ライブラリ
    Pythonでは、科学技術計算でよく使われるNumPy(ナンパイ)やグラフ描画に使われるMatplotlib(マットプロットリブ)、データ解析を支援する機能を提供するPandas(パンダス)など、多くの便利な機能がライブラリという形で提供されます。これらのインストール方法や利用するのに必要な基礎知識について説明しています。

    第16章. NumPyでベクトル・行列計算
    NumPy(ナンパイ)は、ベクトルや行列などを効率的に数値計算するための数学関数ライブラリを提供します。ここでは次のようなトピックについて解説していきます。
    ・NumPyでのベクトル、行列の作成方法
    ・連続した配列の自動作成
    ・ランダムな数値を含む配列の自動作成
    ・NumPyでの行列の計算方法
    ・NumPyでの配列のインデックス
    ・NumPyでの配列の更新
    ・NumPyの数値計算用関数
    ・whereで条件に応じたデータを抽出
    ・NumPyでのファイル操作関数

    第17章. Matplotlibでグラフの描画
    Pythonのグラフの描画に欠かせないのが、Matplotlib(マットプロットリブ)になります。Matplotlibは、Pythonのグラフ描画用ライブラリで、様々なグラフを作成し、データを可視化することができます。この章では、Matplotlibで折れ線グラフ、棒グラフ、円グラフ、散布図など各種グラフの描画方法を解説していきます。

    第18章. Pandasでデータ分析
    Pandas(パンダス)とは、データを効率的に扱うために開発されたPythonのライブラリの1つで、データ分析、機械学習、ディープラーニングには必要不可欠なものになります。ここでは次のようなトピックについて説明していきます。
    ・Seriesの基本(作成、参照、要素の追加、削除、インデックスなど)
    ・DataFrameの基本(作成、参照、要素の追加、削除、インデックスなど)
    ・DataFrameへのインデックス追加と削除
    ・DataFrameのソート(インデックス、列名、指定した値)
    ・DataFrameの参照(単一インデックス)
    ・DataFrameの参照(階層型インデックス)
    ・DataFrameから条件指定でのデータ抽出
    ・Excel、CSVファイルの読み込み、書き込み
    ・DataFrameの結合(Union)
    ・DataFrameの結合(Join)
    ・ピボットテーブルの作成
    ・時系列データの分析

    [文字数 / ページ数]
    約60,250 / 約310ページ


    [著者紹介]
    清水 義孝 (しみず・よしたか)
    データサイエンティスト
    1973年生まれ。
    小学生の頃からプログラミングに興味を持ち、MSXでベーシックを習得し、ゲームの自作に夢中になる。

    大学卒業後は、某大手IT企業でシステムエンジニアとして、数々のデータウェアハウス、データ分析基盤の導入に携わる。その中で、データ分析に興味を持ち始め、データ分析には、ITの知識、スキルだけでなく、ビジネスに関する深い知識やスキルが必要だと感じる。

    論理・仮説思考力、統計・定量分析、プレゼンなどのスキル、ファイナンス・マーケティングなどのビジネスの知識を習得すべく、海外のビジネススクールに通いMBA(経営学修士)取得。

    その後、某大手製造業でデータサイエンティストとして、ビックデータの分析に携わる。
    データ分析、プログラミングに関して、初心者に役立つ情報を発信すべく、2018年よりWebサイト「Pythonで学ぶデータ分析・AI・機械学習」( https://ai-inter1.com/ )の運営を始める。
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    近年、企業が円滑にビジネスを進める上で取り扱うデータ量は急増し、本格的なビッグデータ時代の到来がさけばれています。それに伴い、これらビックデータを分析しビジネスに活用するデータサイエンティストの需要も高まっており、各企業では、データサイエンティストの育成に力を入れたり、高額な給与で採用したりと、人材不足に対応する動きが盛んになってきています。

    データサイエンティストに欠かせないスキルの1つが、データ分析、ディープラーニング、機械学習などに必要となるプログラミングのスキルです。その中でも、Python(パイソン)に関する知識は必要不可欠となります。

    Python(パイソン)は、直観的で非常にわかりやすいプログラミング言語で、シンプルに記述することができ、初心者でも大変学びやすい言語です。

    また、たくさんのライブラリと呼ばれる再利用可能なプログラムが公開されていて、これらのライブラリを使って、比較的簡単に高度な機能を実現することができます。AIに関連するライブラリも数多くあり、機械学習、ディーブラーニングやデータ分析の分野でも広く使われています。

    Pythonの開発環境だけで無く、これらの非常に便利なライブラリがインターネット上で無料で提供されており、費用をかけずに始めることができます。

    この本では、今後データサイエンスや機械学習、AIを学習していきたいと考えている方へ向けて、それらの知識の習得に欠かせないPythonの基本的なトピックに重点を絞り、チュートリアル形式で解説していきます。プログラミング未経験者や初心者でもわかりやすいよう、丁寧に解説していきます。特にPythonでデータ分析・AI・機械学習を学ぶ上で欠かせない基礎となる重要な事項を取り上げています。


    【 目次 】
    第1章. 環境準備
    この章では、Pythonを始めるにあたって欠かすことのできない、環境構築の方法について、初心者でもわかりやすいよう、1つ1つの手順を追って、丁寧に説明しています。是非この記事を元にPythonの開発環境を準備し、プログラミングにチャレンジしてください。

    第2章. 基本操作
    第1章で準備した開発環境について、今後の章の理解に必要となる基本的な操作の説明をしています。

    第3章. 変数
    最初に基本となるPythonの変数の宣言や変数名のルールを説明しています。変数とは何か?という説明から、具体的な例を用いて使い方の説明など、初心者にもわかりやすいよう丁寧な解説を心がけています。

    第4章. データ型
    次にPythonに用意されているデータ型の種類とその確認方法を説明しています。

    第5章. 数値計算(四則演算)
    Pythonでは、数値は四則演算を行うことができるように演算子が用意されています。Pythonに用意されている基本的な四則演算を行うための演算子を確認していきましょう。

    第6章. Print関数
    画面にメッセージを表示したり、記述したプログラムが正常に動作するか確認する際に、変数などに格納された値を画面に出力するのに必要なprint関数についての解説です。

    第7章. リスト(List)
    Pythonにおけるリスト(配列)の使い方に関する記事です。リストとは何か?その特徴は?という基本的な説明から始まり、リストへの要素の追加の方法や、追加した要素の変更、削除方法、また検索方法について説明しています。

    第8章. タプル(Tuple)
    タプルは読み取り専用のリストのようなものです。タプルについても定義の仕方や検索方法について解説していきます。

    第9章. ディクショナリ(Dictionary)
    Pythonには、キーと紐付けて値を登録することで、取り出しやすいかたちでデータを格納することができるDictionary(辞書)というものがあり、特徴や使い方を取り上げています。

    第10章. 条件分岐(IF文)
    この章では、Pythonにおける条件分岐(If文)の記述方法や注意点について見ていきます。

    第11章. 繰り返し処理(For文)
    Pythonの繰り返し処理の1つであるFor文の書き方や使い方の例を取り上げています。

    第12章. 繰り返し処理(While文)
    Pythonの繰り返し処理にはWhile文もあり、For文との違いやWhile文の使い方を説明しています。

    第13章. コメント
    プログラムに関する注釈であるコメントについての書き方や、規約・ルールの例、便利な表示方法について解説しています。

    第14章. 関数
    何度も繰り返し利用する処理は、関数と呼ばれる一連の命令として定義しておくと、同じコードを記述する必要が無く、関数を呼び出すだけで良いので非常に便利です。ここでは、関数の記述方法や呼び出し方について説明しています。

    第15章. モジュール、パッケージ、ライブラリ
    Pythonでは、科学技術計算でよく使われるNumPy(ナンパイ)やグラフ描画に使われるMatplotlib(マットプロットリブ)、データ解析を支援する機能を提供するPandas(パンダス)など、多くの便利な機能がライブラリという形で提供されます。これらのインストール方法や利用するのに必要な基礎知識について説明しています。

    [文字数 / ページ数]
    約25,000 / 約140ページ


    [著者紹介]
    清水 義孝 (しみず・よしたか)
    データサイエンティスト
    1973年生まれ。
    小学生の頃からプログラミングに興味を持ち、MSXでベーシックを習得し、ゲームの自作に夢中になる。

    大学卒業後は、某大手IT企業でシステムエンジニアとして、数々のデータウェアハウス、データ分析基盤の導入に携わる。その中で、データ分析に興味を持ち始め、データ分析には、ITの知識、スキルだけでなく、ビジネスに関する深い知識やスキルが必要だと感じる。

    論理・仮説思考力、統計・定量分析、プレゼンなどのスキル、ファイナンス・マーケティングなどのビジネスの知識を習得すべく、海外のビジネススクールに通いMBA(経営学修士)取得。

    その後、某大手製造業でデータサイエンティストとして、ビックデータの分析に携わる。
    データ分析、プログラミングに関して、初心者に役立つ情報を発信すべく、2018年よりWebサイト「Pythonで学ぶデータ分析・AI・機械学習」( https://ai-inter1.com/ )の運営を始める。
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    本書は「よくわかるPython3入門」シリーズの第2弾で、主に科学技術計算でよく使われるNumPy(ナンパイ)やグラフ描画に使われるMatplotlib(マットプロットリブ)というライブラリを解説したものになります。

    「よくわかるPython3入門」シリーズの第1弾の基礎編をまだご覧になられておられない方は、そちらから始められることをお勧めします。

    近年、企業が円滑にビジネスを進める上で取り扱うデータ量は急増し、本格的なビッグデータ時代の到来がさけばれています。それに伴い、これらビックデータを分析しビジネスに活用するデータサイエンティストの需要も高まっており、各企業では、データサイエンティストの育成に力を入れたり、高額な給与で採用したりと、人材不足に対応する動きが盛んになってきています。

    データサイエンティストに欠かせないスキルの1つが、データ分析、ディープラーニング、機械学習などに必要となるプログラミングのスキルです。その中でも、Python(パイソン)に関する知識は必要不可欠となります。

    Python(パイソン)は、直観的で非常にわかりやすいプログラミング言語で、シンプルに記述することができ、初心者でも大変学びやすい言語です。

    また、たくさんのライブラリと呼ばれる再利用可能なプログラムが公開されていて、これらのライブラリを使って、比較的簡単に高度な機能を実現することができます。AIに関連するライブラリも数多くあり、機械学習、ディーブラーニングやデータ分析の分野でも広く使われています。

    Pythonの開発環境だけで無く、これらの非常に便利なライブラリがインターネット上で無料で提供されており、費用をかけずに始めることができます。

    この本では、今後データサイエンスや機械学習、AIを学習していきたいと考えている方へ向けて、それらの知識の習得に欠かせないPythonの基本的なトピックに重点を絞り、チュートリアル形式で解説していきます。プログラミング未経験者や初心者でもわかりやすいよう、丁寧に解説していきます。特にPythonでデータ分析・AI・機械学習を学ぶ上で欠かせない基礎となる重要な事項を取り上げています。


    【 目次 】
    第1章. 環境準備
    この章では、Pythonを始めるにあたって欠かすことのできない、環境構築の方法について、初心者でもわかりやすいよう、1つ1つの手順を追って、丁寧に説明しています。是非この記事を元にPythonの開発環境を準備し、プログラミングにチャレンジしてください。

    第2章. 基本操作
    第1章で準備した開発環境について、今後の章の理解に必要となる基本的な操作の説明をしています。

    第3章. NumPyでベクトル・行列計算
    NumPy(ナンパイ)は、ベクトルや行列などを効率的に数値計算するための数学関数ライブラリを提供します。ここでは次のようなトピックについて解説していきます。
    ・NumPyでのベクトル、行列の作成方法
    ・連続した配列の自動作成
    ・ランダムな数値を含む配列の自動作成
    ・NumPyでの行列の計算方法
    ・NumPyでの配列のインデックス
    ・NumPyでの配列の更新
    ・NumPyの数値計算用関数
    ・whereで条件に応じたデータを抽出
    ・NumPyでのファイル操作関数

    第4章. Matplotlibでグラフの描画
    Pythonのグラフの描画に欠かせないのが、Matplotlib(マットプロットリブ)になります。Matplotlibは、Pythonのグラフ描画用ライブラリで、様々なグラフを作成し、データを可視化することができます。この章では、次のトピックを解説していきます。
    ・Matplotlibで折れ線グラフの描画
    ・Matplotlibで棒グラフの描画・
    ・Matplotlibで円グラフの描画
    ・Matplotlibで散布図の描画
    ・Matplotlibで複数のグラフを並べて表示

    [文字数 / ページ数]
    約20,500 / 約130ページ


    [著者紹介]
    清水 義孝 (しみず・よしたか)
    データサイエンティスト
    1973年生まれ。
    小学生の頃からプログラミングに興味を持ち、MSXでベーシックを習得し、ゲームの自作に夢中になる。

    大学卒業後は、某大手IT企業でシステムエンジニアとして、数々のデータウェアハウス、データ分析基盤の導入に携わる。その中で、データ分析に興味を持ち始め、データ分析には、ITの知識、スキルだけでなく、ビジネスに関する深い知識やスキルが必要だと感じる。

    論理・仮説思考力、統計・定量分析、プレゼンなどのスキル、ファイナンス・マーケティングなどのビジネスの知識を習得すべく、海外のビジネススクールに通いMBA(経営学修士)取得。

    その後、某大手製造業でデータサイエンティストとして、ビックデータの分析に携わる。
    データ分析、プログラミングに関して、初心者に役立つ情報を発信すべく、2018年よりWebサイト「Pythonで学ぶデータ分析・AI・機械学習」( https://ai-inter1.com/ )の運営を始める。
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    本書は「よくわかるPython3入門」シリーズの第3弾で、第1弾と第2弾の内容を合わせたものとなります。

    第1弾で解説したPythonの基礎と合わせて、第2弾の科学技術計算でよく使われるNumPy(ナンパイ)やグラフ描画に使われるMatplotlib(マットプロットリブ)というライブラリを解説したものになります。

    近年、企業が円滑にビジネスを進める上で取り扱うデータ量は急増し、本格的なビッグデータ時代の到来がさけばれています。それに伴い、これらビックデータを分析しビジネスに活用するデータサイエンティストの需要も高まっており、各企業では、データサイエンティストの育成に力を入れたり、高額な給与で採用したりと、人材不足に対応する動きが盛んになってきています。

    データサイエンティストに欠かせないスキルの1つが、データ分析、ディープラーニング、機械学習などに必要となるプログラミングのスキルです。その中でも、Python(パイソン)に関する知識は必要不可欠となります。

    Python(パイソン)は、直観的で非常にわかりやすいプログラミング言語で、シンプルに記述することができ、初心者でも大変学びやすい言語です。

    また、たくさんのライブラリと呼ばれる再利用可能なプログラムが公開されていて、これらのライブラリを使って、比較的簡単に高度な機能を実現することができます。AIに関連するライブラリも数多くあり、機械学習、ディーブラーニングやデータ分析の分野でも広く使われています。

    Pythonの開発環境だけで無く、これらの非常に便利なライブラリがインターネット上で無料で提供されており、費用をかけずに始めることができます。

    この本では、今後データサイエンスや機械学習、AIを学習していきたいと考えている方へ向けて、それらの知識の習得に欠かせないPythonの基本的なトピックに重点を絞り、チュートリアル形式で解説していきます。プログラミング未経験者や初心者でもわかりやすいよう、丁寧に解説していきます。特にPythonでデータ分析・AI・機械学習を学ぶ上で欠かせない基礎となる重要な事項を取り上げています。


    【 目次 】
    第1章. 環境準備
    この章では、Pythonを始めるにあたって欠かすことのできない、環境構築の方法について、初心者でもわかりやすいよう、1つ1つの手順を追って、丁寧に説明しています。是非この記事を元にPythonの開発環境を準備し、プログラミングにチャレンジしてください。

    第2章. 基本操作
    第1章で準備した開発環境について、今後の章の理解に必要となる基本的な操作の説明をしています。

    第3章. 変数
    最初に基本となるPythonの変数の宣言や変数名のルールを説明しています。変数とは何か?という説明から、具体的な例を用いて使い方の説明など、初心者にもわかりやすいよう丁寧な解説を心がけています。

    第4章. データ型
    次にPythonに用意されているデータ型の種類とその確認方法を説明しています。

    第5章. 数値計算(四則演算)
    Pythonでは、数値は四則演算を行うことができるように演算子が用意されています。Pythonに用意されている基本的な四則演算を行うための演算子を確認していきましょう。

    第6章. Print関数
    画面にメッセージを表示したり、記述したプログラムが正常に動作するか確認する際に、変数などに格納された値を画面に出力するのに必要なprint関数についての解説です。

    第7章. リスト(List)
    Pythonにおけるリスト(配列)の使い方に関する記事です。リストとは何か?その特徴は?という基本的な説明から始まり、リストへの要素の追加の方法や、追加した要素の変更、削除方法、また検索方法について説明しています。

    第8章. タプル(Tuple)
    タプルは読み取り専用のリストのようなものです。タプルについても定義の仕方や検索方法について解説していきます。

    第9章. ディクショナリ(Dictionary)
    Pythonには、キーと紐付けて値を登録することで、取り出しやすいかたちでデータを格納することができるDictionary(辞書)というものがあり、特徴や使い方を取り上げています。

    第10章. 条件分岐(IF文)
    この章では、Pythonにおける条件分岐(If文)の記述方法や注意点について見ていきます。

    第11章. 繰り返し処理(For文)
    Pythonの繰り返し処理の1つであるFor文の書き方や使い方の例を取り上げています。

    第12章. 繰り返し処理(While文)
    Pythonの繰り返し処理にはWhile文もあり、For文との違いやWhile文の使い方を説明しています。

    第13章. コメント
    プログラムに関する注釈であるコメントについての書き方や、規約・ルールの例、便利な表示方法について解説しています。

    第14章. 関数
    何度も繰り返し利用する処理は、関数と呼ばれる一連の命令として定義しておくと、同じコードを記述する必要が無く、関数を呼び出すだけで良いので非常に便利です。ここでは、関数の記述方法や呼び出し方について説明しています。

    第15章. モジュール、パッケージ、ライブラリ
    Pythonでは、科学技術計算でよく使われるNumPy(ナンパイ)やグラフ描画に使われるMatplotlib(マットプロットリブ)、データ解析を支援する機能を提供するPandas(パンダス)など、多くの便利な機能がライブラリという形で提供されます。これらのインストール方法や利用するのに必要な基礎知識について説明しています。

    第16章. NumPyでベクトル・行列計算
    NumPy(ナンパイ)は、ベクトルや行列などを効率的に数値計算するための数学関数ライブラリを提供します。ここでは次のようなトピックについて解説していきます。
    ・NumPyでのベクトル、行列の作成方法
    ・連続した配列の自動作成
    ・ランダムな数値を含む配列の自動作成
    ・NumPyでの行列の計算方法
    ・NumPyでの配列のインデックス
    ・NumPyでの配列の更新
    ・NumPyの数値計算用関数
    ・whereで条件に応じたデータを抽出
    ・NumPyでのファイル操作関数

    第17章. Matplotlibでグラフの描画
    Pythonのグラフの描画に欠かせないのが、Matplotlib(マットプロットリブ)になります。Matplotlibは、Pythonのグラフ描画用ライブラリで、様々なグラフを作成し、データを可視化することができます。この章では、Matplotlibで折れ線グラフ、棒グラフ、円グラフ、散布図など各種グラフの描画方法を解説していきます。

    [文字数 / ページ数]
    約38,000 / 約200ページ


    [著者紹介]
    清水 義孝 (しみず・よしたか)
    データサイエンティスト
    1973年生まれ。
    小学生の頃からプログラミングに興味を持ち、MSXでベーシックを習得し、ゲームの自作に夢中になる。

    大学卒業後は、某大手IT企業でシステムエンジニアとして、数々のデータウェアハウス、データ分析基盤の導入に携わる。その中で、データ分析に興味を持ち始め、データ分析には、ITの知識、スキルだけでなく、ビジネスに関する深い知識やスキルが必要だと感じる。

    論理・仮説思考力、統計・定量分析、プレゼンなどのスキル、ファイナンス・マーケティングなどのビジネスの知識を習得すべく、海外のビジネススクールに通いMBA(経営学修士)取得。

    その後、某大手製造業でデータサイエンティストとして、ビックデータの分析に携わる。
    データ分析、プログラミングに関して、初心者に役立つ情報を発信すべく、2018年よりWebサイト「Pythonで学ぶデータ分析・AI・機械学習」( https://ai-inter1.com/ )の運営を始める。
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    本書は、ディープラーニングの研究分野の中でも生成モデルにフォーカスをあてて理論および実装を説明しています。

    生成モデルの基本的な概念・考え方についてまず取り上げた後、生成モデルとして有名な2つのモデルである、変分オートエンコーダ (variational autoencoder, VAE) および 敵対的生成ネットワーク (generative adversarial network, GAN) について、それぞれ理論および実装を紹介します。実装には PyTorch (1.X) を用います。

    • 画像認識の勉強はしたけれど、画像生成に関しても勉強してみたい
    • 生成モデルはなんとなく知っているけれど、もっと詳しく理解したい

    という方にとって、本書はとても相性が良いでしょう。数式を交えて説明していきますので、数式がどのように実装に落とし込まれるのかを理解することで、今後のより発展的な内容の学習にも役立つことと思います。  
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
    機械学習において、どの様なアルゴリズムがあるのか俯瞰するのに良いと思います。ただ、212ページで、この値段は....。
    機械学習のための各アルゴリズムの特徴が、各アルゴリズムの冒頭に記されているのだが、これが抽象的で理解しずらい。
    もう少し、歴史的な背景とかなぜこのようなアルゴリズムが必要になったのかとか実際にどのようなことに役立ってきたのかなどが記載されていないので、読者からすると入門書でありながら書かれている内容が抽象的になってしまい過ぎて理解しにくい。いろいろな簡単な例について説明されているが、このらの例も簡単すぎて実際にどのようなときに使用したらよいのか、などが分かりにくい。理論自体、あるいはそこで使用されている数学自体は簡単なものが多いので、もう少し工夫してわかりやすく書いてほしかった。内容はやさしくても、そこになぜそうなるのかという理論がわかりやすく書かれていないと理解しにくい。読者は子供の使いではないので、簡単な例だけで、こういうふうに理解しろと言われてもそれは無理だ。
    結局この本だけではダメなので、インターネットで関連するいろいろな記事を読むことにより、明確なイメージをつかむことができた。
    ■良かった点
    ・各ページの構成・見栄えがとても良く、機械学習の難しい話をとっつきやすく解説してくれている
    ・アルゴリズムの網羅性が高く、見やすさ/とっつきやすさと相まって、知らないアルゴリズムがあったときに心理的な障壁がなく気軽に本書で調べることができる
    ■もう一歩な点
    ・各アルゴリズムの詳細な解説は完璧に省かれているため、数学的な原理を知りたい場合はネット等で別途調査する必要がある。
     
       
    本書の内容
    はじめに

    この度は、「Python + LINEで作る人工知能開発入門 - Flask + LINE Messaging APIでの人工知能LINEボットの作り方 」を手に取っていただきまして、誠にありがとうございます。

    本書はPythonというプログラミング言語を使って人工知能を使ったLINEボットの開発を始めたい人を対象に基礎的な内容をまとめたものです。

    この内容は筆者がPythonを使って試行錯誤した成果をまとめたものです。

    本書ではPythonのFlaskというフレームワークをサーバーサイドにして、GoogleのVision APIというサービスを呼び出すことでGoogleの人工知能を間接的に利用して、面白いLINEボットを作成するための基礎的なノウハウをまとめています。

    この本を通じて実用段階にある人工知能のレベルとはどのようなものか?どんなことができるのか?ということが体験できると考えています。

    また、LINEボットの開発に挑戦したいと考えている場合にも適していると思います。

    本書はリフロー型のKindle電子書籍のフォーマットを採用しています。

    一般的な紙の本とは異なる装丁を採用しているため、Kindle本をあまり利用されたことのない方は事前に「無料サンプルを送信する」の機能を利用して、確認をお願いします。


    目次

    1. AIと絡めた本書の内容の説明

    1.1 AIとは何か?
    1.2 人工知能アプリを作ることは本当に難しいのか?
    1.3 機械学習APIを使用するという提案
    1.4 LINEボットと人工知能の組み合わせ
    1.5 なぜPythonを使用するのか?
    1.6 本書の流れ

    2. Python

    2.1 Python2とPython3
    2.2 Pythonの基本的な取り扱い
    2.3 Pythonの基本文法
    2.4 venv

    3. LINE Botのバックエンドを構築するための下準備 - Flaskの基本

    3.1 なぜLINE Botでバックエンドを構築する必要があるのか?
    3.2 なぜLINE BotのバックエンドにFlaskを使用するのか?
    3.3 Flaskの特徴
    3.4 Flaskの導入
    3.5 Flaskの基本的なルール
    3.6 ルーティング
    3.7 URLの基本構造 ~ Webアプリケーションの場合
    3.8 リクエスト
    3.9 Flaskでのログの扱い
    3.10 FlaskでのJSONの取り扱い

    4. Herokuを使用したFlaskのデプロイ

    4.1 Herokuとは?
    4.2 Herokuのアカウントを取得する
    4.3 Herokuのコマンドラインツールを導入する
    4.4 コマンドラインツールを使ってHerokuにログインする
    4.5 HerokuでFlaskのアプリケーションをデプロイ


    5. LINEボットの作り方

    5.1 LINEの開発者アカウントを作成する
    5.2 プロバイダーを作成する
    5.3 チャネルを作成する
    5.4 LINE BOTでHello World
    5.5 Flaskでバックエンドサーバーを構築する - Messaging API SDKでWebhookサーバーを実装
    5.6 LINE Botでユーザーから送信されたコンテンツを取得

    6. Google Cloud Vision APIとの連携

    6.1 Google Cloudの導入
    6.2 Google Cloud Vision APIの登録を行う
    6.3 文字認識(OCR)の機能を呼び出して文字起こしボットを作成する
    6.4 顔検出の機能を呼び出してプライバシー保護Botを作成する
    6.5 オリジナルのLINE Botを作ってみよう

    コードが動かないなどのトラブルシューティングについて

    基本的に本書で記載しているOSなどの環境上で手順に従えばコードが動作することをすベて確認しています。

    万が一、コードが動かなかった場合はエラーが発生する条件を再現できるよう必ず以下の情報をすベて併記した上で筆者にダイレクトメッセージを送ってください。

    * エラーが発生したソースコード全体
    * ソースコードに対応する本のページ番号や章番号
    * OSの種類とバージョン(WindowsかMacOSかLinux、そしてそのバージョン)
    * プログラミング言語のバージョン(Python3.6かPython3.7)
    * フレームワークやパッケージのバージョン


    GitHubなどにエラーが発生したソースコード一式を公開していただけばエラーがどのような条件で実際に発生するかを再現・検証できるため、できる限り協力をお願いします。

    以上の情報抜きで単純に「動かなかった!」などの詳細情報を省いた短いコメントを投稿されても、どのような条件でエラーが発生するのか検証できず、筆者側のミスか単なる勘違いかも分からず、また返信などのサポートもできないため控えていただくように重ねてお願い申し上げます。  
    内容サンプル
     
    User Voice
    ユーザーから取得した画像の処理で悩んでいました。Qiitaではわかりきらなかったのですが、この本でばっちりわかりました。ストックしたあちこちの記事を読む必要もなく作業が捗ります。Lineの資料など、第一次資料から読み取るのはまだ抵抗があるし、本当に助かります。
    このコードで本当に出来るのか疑問です。私は出来ませんでした。ネットで見つけたコードの方がわかりやすい上に出来ました。
    内容がとても充実していてほしい情報をこと細かく書いてあったのでサイトよりも参考になります。有難う御座いました。
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
    Deep Learning に関する本が沢山出ていますが、「数学はさておいて!」という本が多々あります。
    それでは、とても Deep Learning など解るわけがないと思っていました。
    とりあえず、「ゼロから作る Deep Learning (斉藤泰毅著)」を読みました。数学もある程度丁寧に説明していて、よかったと思っています。しかし、今少し数学をまとめてあればいいのにと思っているとき、この「最短コースでわかるディープラーニングの数学」に出会い、懐かしい高校1年生から、大学教養数学まで感心するぐらいうまくまとめてあるので、じっくりやり直して見ることが出来ました。pythonにはかなり自信がありますが、私は「データ・サイエンティスト」にはなれません。「AI,Deep Lerarning とはどのようなものか知りたい!」だけです。85才の老人です。
    MITのopencourse 3時間の内容と同じ...買った損ね
    最近AIを勉強しようかと思ってAmazonで本を探してこの本に出合えました。
    「導入編」「理論編」「実践編」「発展編」に分けており、高校数学のレベルでAIの基礎知識から実際応用まで関係を分かりやすく説明しています。
    高校までに数学に得意だった自分は「なるほど。AIの本質は数学なんだ」という感がすごくあります。
    AIの仕組みを理解したい人にはお勧めです。
     
       
    本書の内容

    医療関係者が人工知能をはじめて本格的に学ぶことができる一冊。人工知能と医療(主に画像)とのかかわりを詳しく解説。後半の事例編では、具体的な応用例、研究例を掲載し、医療AIの今が理解できる内容となっている。

     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    ビジネスの現場で活用するための最短コースです!

    本書は野村総合研究所のシステムコンサルティング事業本部で実施している
    「アナリティクス研修」をベースにした書籍で、
    「統計的なモデリングとは何か?」
    「モデルに基づく要因の分析と予測の違いとは?」
    「具体的なモデルの作り方」
    「結果を解釈する際の落とし穴の見分け方」
    など、ビジネスの現場感を重視した構成です。
    実務で遭遇するデータ品質や加工のポイント、さらにRとPythonを利用し、
    データからモデルを作成して結果を得るという基本的な手順を体験できます。
    これからデータ分析や統計解析、機械学習を学び、現場でそれらを活用したい方に最短学習コースでお届けします。
     
    内容サンプル
     
    User Voice
    Rをメインに使用している技術者です。統計解析・機械学習を俯瞰的に学ぶために購入しました。
    さすが野村総合研究所の研修がベースになっているだけあって、
    本の内容は数式を可能な限り抑えて実務者にも分かりやすい内容となっていました。
    「はじめに」に書かれている通り本書を通じて
    ・統計モデリングの概念、要因分析と予測の違い
    ・実際にモデルを作成したり、結果を解釈したりする際の注意点
    といったほかの書籍にあまり書かれていない内容を学べ、大変参考となりました。
    この内容が3000円で買えるのは破格じゃないでしょうか?
    ただし、
     ①R・Pythonに関して全くの初心者
     ②統計学と機械学習を学んだことがない
    ①②の両方に当てはまる方が読み進めるのは難しいと思います。
    自分のレベルに合致しているか確かめたうえで購入しましょう。
    416ページと厚めの本で、機械学習やディープラーニングまで扱っていますが、数式はほとんど使われていません。せいぜい、y = ax+b のような線形モデルの式がアクセントに出てくる程度です。分析手法や、それを理解するための概念は、すべて言葉と図で説明されており、実装例としてPythonとRで書かれたコードが紹介されています。

    本書は、NRI社内での研修資料をベースにしているそうですが、SIerの非理系エンジニアが「まずは動かして、大まかなイメージをつかむ」ためには最適な内容だと思います。エンジニアの中には、学生時代から理工系で、数学的素養があり、高度なアルゴリズムを自ら開発している人もいるとは思いますが、そうでない(文系採用)人もたくさんいて、その人達の底上げのための教材としてよくできた内容だと思います。

    一方で、研修の目的が「分析人材育成のための入り口」だそうなので、ある程度理工系のキャリアがあって、数学的な概念の理解やアルゴリズムの詳細なチューニングをしたいという人のニーズは満たせないと思いますが、それは本書の企画意図どおりなのだろうと思います。
    データ処理の実務上不要と思われる統計学の解説はともかくとして、勾配ブースティング決定木の解説が一切ないには今年の出版としては大問題ではないかと思う。

    上のレビューは酔っ払った勢いでつい書いてしまったものなので、少しは反省して補足しようかとも思いますが、
    データサイエンスと持て囃されても
    (日本の大企業が)業務で使うのは結局は古典的な統計学だということがおぼろげながら分かってきたので本書の内容は仕方が無いもします。
    しかしながら書名に大きく「機械学習」と銘打っている以上、GBDTが出てこないのは、現状では表形式データに真っ先に適用すべき機械学習モデルとされていることからすると容認し難いと思います(ちなみにランダムフォレストなら多少出て来ます)。

    更に少し追加しますが生物系の統計の本を読んでいたところ
    多重共線という言葉が出てきて全く意味不明だったのですが
    この本に非常に分かりやすい図解があったのでそういう面では助かります。
    とはいえ改めてページをめくると説明に使われている例に
    日本の企業社会の情けなさが滲み出てるので評価を変える気には到底なれません。

    更にちなみにですが、この本では「検定」はモデル評価の指標のあくまで一例として扱われています。
    またそのせいかも知れませんが、上述の「多重共線」は出て来ても「多重検定」は出て来ません。なので上に書いたとおり機械学習の入門書としては疑問がありますが、データサイエンスの入門書としては間違いなく良識ある一冊だと思います。
    でも評価点は変更なしです。
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
    データセットは自分で一つ一つ提供元のサイトからダウンロードしなくてはいけない。権利が取れなかった?模様。自分で本に載っているURLからダウンロードしてくれとのこと

    ただデータ量が重い。スペックに依存するが、私のローカルPCだと扱いづらかった。なんで他の扱いやすいオープンソースのデータで説明しなかったのか疑問。そのため、githubで公開されているサンプルプログラムを実行しながら内容を理解する方法は一旦断念した。勿体無いので、時間があるときにデータをダウンロードしておいて、確認する。

    内容は正直courseraの機械学習の授業(How to Win a Data Science Competition: Learn from Top Kagglers)や他の書籍で学んだ内容だったので、私が期待していた内容とは違った印象。再チャレしたらまたレビュー更新するが、プログラムが実行しにくい点で今の所は2点。
    タイトルに特徴量エンジニアリングを謳った唯一の本のようですが、いわゆるデータサイエンスを生業にしている人向けの本で、word2vecでさえ省かれているので表形式以外のデータの入力の表現に関心がある人には物足りないかも知れません。

    というか自分が関心があるのは、この本では省いた、として挙げられた中にも含まれていないグラフやゲノムの入力表現なので、自分の関心が偏っているだけだとは思いますが

    ところで実際に「特徴量工学」(または「表現工学」)という用語があることを他の本で知りましたが、この本以外に情報が無いので現状どうなっているか分かりません。
    出版前にネットで話題になっていたこともあったのでとりあえず購入。
    私の率直な感想は、特に本書から新たに手に入った情報はなかったかなといったところ。
    本書の想定読者がやや不明ですが、分量が少ないのでサクッと読めて、まあ、それなりに楽しめます。
     
       
    本書の内容
    Pythonデータ分析+機械学習への第一歩! 本格学習の前に、基礎を固め、全容を把握。― データの取り込み・整備・集約から、可視化、モデル化、正規化、高速化など、一連の基本作法を学べます。付録では、Python環境のインストール、Pythonの文法などを確認できます。使用するライブラリは、pandasを中心に、matplotlib、seaborn、numpy、statsmodels、sklearnなど。本書は『Pandas for Everyone: Python Data Analysis』の翻訳書です。

    ※この商品は固定レイアウトで作成されており、タブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字列のハイライトや検索、辞書の参照、引用などの機能が使用できません。
    購入前にお使いの端末で無料サンプルをお試しください。  
    内容サンプル
     
    User Voice
    手取り足取り解説してくれるわけではないので初学者向けではないかもしれませんが、ある程度Pythonの知識があれば、スキルアップにとても役立つ本だと思います!色々なPython関連本を取り寄せて比較検討した結果、翻訳本特有の不自然さがなく、体系的に分かりやすく解説してあるところがとても気に入っており、今はこの本だけでスキルアップに励んでいます。
    発売日に買って、コードを実際に打ち込みながら最後まで読みました。

    この本ではpandasを使ってデータを取り込んでいろんな形で視覚化したり分析したりする手順を、基本的なところから始めて順番にやっています。
    Jupyter Notebook で入力しながらやっていくと、内部形式の違いとか分析の比較とかいろいろ確認する手順も語られてて非常に勉強になりました。
    全体の知識量が膨大なので、明日から自由自在に使いこなせるとは思いませんが、pandasなどを使ったデータ処理について何が出来るかの基本的なことはわかったと思います。
    ちゃんと身につけるには継続的に使わないとなー。
    巻末に付録があるのですが、これが凄く充実しているので、
    他言語を習得している人ならこの本を読むだけでPythonの基礎がわかります。
    自分がPythonで最初に混乱したのがExcel的な配列の使い方ですが、
    これは本文で具体的に説明されていて非常にわかりやすく、簡単にデータの整理が出来る様になりました。

    当たり前のことではありますが、機械学習では扱うデータを間違えないことが大前提なので、
    「Pythonって便利だけどよくわからない(自分のパターン)」場合は、
    この本で基礎をキッチリと固めておいた方が良いです。

    本屋でタイトルを見た時は「ファイルを読むだけのライブラリだから不要かな」と思って買うつもりは無かったのですが、
    中身を読んだ時に考えが変わって、購入してじっくり読んだらモヤモヤしていた物がスッキリしましたので、
    意外な良書に巡り合えました。
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容

    本書は、Pythonでプログラミングをした経験のある読者が、
    各種オープンソースソフトウェア(OSS)やライブラリを利用して、
    自然言語処理を行うWebアプリケーションを作って動かし、自然言語処理を体験するための書籍です。

    またその中で、自然言語処理に関連するさまざまな概念や手法、
    簡単な理論についても学ぶことができ、本格的な学習の
    前段階としても最適です。

    本書の構成としては大きく2つの部に分かれており、
    それぞれ以下のような内容を解説しています。

    第1部:データの準備
    ●テキストデータの収集
    ●データベースへの格納
    ●検索エンジンへの登録

    第2部:データの解析
    ●文法構造を調べる
    ●意味づけ
    ●知識データとの連係

    全13章を順に追いながらWebアプリケーションを作っていくことで、
    自然言語処理に関連するさまざまなテーマを学ぶことができます。

    ※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
    ※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
    ※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
    ※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

     
    内容サンプル
     
    User Voice
    初心者にはおすすめしづらいです。
    私は大学で情報系のことを勉強しているため、pythonであったり、自然言語処理に対して、ある程度わかっている状態で読んだので、内容を理解できましたが、初心者そのような分野について知識のない人に対してはあまりにも説明が抜けすぎています。
    プログラムのコードにしてもどこがどのように作用しているといった説明が少ないため、勘違いが生じてしまいます。
    また、上級者に対しては「調べておいてくださいね」とか「あなたのほうがお詳しいですよね」とかといったような突き放されたような書き方が多く見受けられます。
    ついでに例として出されているもの(wikipediaの例など)についても他に良い方法があるのにも関わらず、あえてその方法でやるのかと突っ込みをいれたくなりました。
    もちろん普遍的に分かりやすい例として出しているという意図はつたわりますが、後々使うことになるであろうapiなどの知識を一方で否定してしまうということにもなります。
    そういった点で中途半端な本であるため、このような評価にしました。
    もちろん使える知識もあるんですけどね...
    自然言語処理に関する情報を得るために購入しましたが、データベース・Webアプリなど、自然言語処理にまったく関係ない技術の解説に全体の半分以上が費やされています。オマケと本体のサイズが逆転している、よくある駄菓子のような感じ。オマケマニアにはうれしい本でしょうね♬
    形態素解析から知識資源の活用など、カバーする内容が広いので、自然言語処理そのものの入門ではなく、Python で自然言語処理を扱うための入門という位置付けだと思います。
    内容的は平易で難しい計算式や理論などは省き、具体的なコードで入力から出力まで確認できるので、非常にわかりやすいと思いました。
    たまにコードに間違いらしきものが見受けられましたが、Python の入門書でもないので、各々で解決できる程度だと思いましたが、紙の本なので、それで星ひとつ減らしました。
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    Pythonを始めたからには、やっぱり機械学習でしょう。ほとんどの書籍が、機械学習を取り上げています。
     機械学習とは、「未知の問題に対して、正しい答えが導き出せるように学習させること」と、定義したとき、大きな問題にぶつかります。 

     どうやって学習させるか。これは、Pythonが解決してくれます。機械学習については、非常に構造化されていますから、例えば、教師あり学習の場合、わずか2行のプログラムで学習させることができます。

     では、大きな問題とは?

     どの計算式を使えば良いかの選択です。これができない限り、機械学習に取り組むのは危険です。
     かといって、機械学習の専門書に記述されているような計算式を理解するのは専門家でもない限り、ほぼ、無理といっていいでしょう。

     そこで、この本では、手書き数字認識、アヤメの分類を題材として、プログラムを完成させるまでの手順、数式を理解できないが故に、行って欲しい手順を主に構成しています。

     プログラムは、非常に構造化されているお陰で、公式的なものがほとんどです。教師あり学習については、ここで、記述したプログラムを少し修正するだけで、他でも使用できると思います。
    Chapter1 事前の準備
     §1 認識させたい画像の準備 5
    Chapter2 機械学習につて
     §1 機械学習とは 6
     §2 学習用画像を用意する 7
     §3 画像を表示してみる 9
     §4 何の数字のデータか表示する 12
     §5 生データを取得する 13
    Chapter3 学習する
     §1 教師用(学習用)データを切り取る 14
     §2 学習用プログラム 17
     §3 正解と予測値を表示する 21
     §4 間違えた要因を考えてみる 23
     §5 ベストなCとgammaを設定する 24
     §6 学習結果の保存 28
    Chapter4  実画像の判定
    §1 画像フォーマットの変換 30
     §2 判定します 33
    Chapter5 機械学習モデルについて
     §1 k-最近傍法 34
     §2 線形モデル 38
     §3 サポートベクタマシン(SVM) 40
     §4 決定木 42
     §5 決定木のチューニング 45
    Chapter6 ベストな学習器を選択する
     §1 交差検証 47
    Chapter7 アヤメの分類
     §1 データ構造を調べる 50
     §2 学習する 54
    §3 すべての分類器を試してみる 55
     まとめ
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
    ※このKindle本はプリント・レプリカ形式で、Kindle Paperwhiteなどの電子書籍リーダーおよびKindle Cloud Readerではご利用いただけません。Fireなどの大きいディスプレイを備えたタブレット端末や、Kindle無料アプリ (Kindle for iOS、Kindle for Android、Kindle for PC、Kindle for Mac) でのみご利用可能です。また、文字列のハイライト、検索、辞書の参照、引用については、一部機能しない場合があります。文字だけを拡大することはできません。
    ※プリント・レプリカ形式は見開き表示ができません。
    ※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。

    Pythonでデータサイエンスの理論と実践を学ぶ
     データサイエンスは、「データを科学的に扱う」学問分野であり、近年、ICTの進展によって、センサやインターネットを通じて取得できるデータ量が爆発的に増加したこと、コンピュータの高性能化に伴ってこれまでできなかった大規模なデータ処理が可能となったことなどから注目されています。
     本書は、データサイエンスの意味から金融データの分析、動的システムの分析などの工学応用までを、Pythonを使って実際に分析しながら学ぶものです.データの取り扱い、確率・統計の基礎といった基本的なところから、回帰分析、パターン認識、深層学習といった統計・機械学習手法、金融データなど時々刻々と変化する時系列データの分析、センサデータなどに含まれるノイズや外乱を見極めるスペクトル分析、さらにこのノイズや外乱を除去するためのディジタルフィルタ、そして最後に画像データの分析として画像処理の解説を行い、読者がデータサイエンスの一通りを俯瞰できるようになっています。
     Pythonを使った解説によって理論と実践を同時に学ぶことができるので、データサイエンスを学び、自身の分野に応用したい方にピッタリの一冊です。

    1章 はじめに
    2章 データの扱いと可視化
    3章 確率の基礎
    4章 統計の基礎
    5章 回帰分析
    6章 パターン認識
    7章 深層学習(ディープラーニング)
    8章 時系列データ分析
    9章 スペクトル分析
    10章 ディジタルフィルタ
    11章 画像処理
    おわりに
    参考文献  
    内容サンプル
     
    User Voice
    生のPythonは自在に書ける状態で、統計の入門としてこの本を買いました。
    統計数学の入門としてはPyPlotによる図や噛み砕いた解説がわかりやすかったと思います。

    しかしPythonのコードとしては甚だ疑問です。
    Numpyの配列には演算子のオーバーロードが定義されていて、なるべくfor文を使わずに書いたり内包表記で書いたりすることがPythonでの数値計算では重要ですが、全く対応していません。
    文字列の操作や空の配列を先に定義するスタイルからも読み取れるのですが、まるでC言語のようにPythonを書いています。これではPythonで数値計算をしていることにはなりません。

    著者は制御数学で有名な先生なようですので、今後の出版物を期待したいと思います。
    特にJuliaで統計モデルを書く本を期待しています。
    データサイエンスの理論をまとめた本であるが、
    統計的な話と工学的な話が抱負に記載されていて参考になる。

    Pythonで学ぶ と書かれているが、スクリプトの話はわずかで、
    理論を中心に書かれているので、
    Pythonの勉強は他で行う必要があるようだ。

    所々に入るおまけのコラムが結構おもしろい。
    データサイエンスの学習
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    発売日 2019/01/12
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       
    本書の内容
     
    内容サンプル
     
    User Voice
     
       

    機械学習 高評価のおすすめ本 ランキング


    Copyrights hogehoge