# GPUが利用可能か確認
import tensorflow as tf  # tensorflow モジュールをインポート
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))

Num GPUs Available:  0

# import tensorflowでエラーにならなければ必要ない
!pip install tensorflow

!tar xzf Oxford-IIIT-Pet-Dataset-Birman--chihuahua.tgz

!tar xzf O*.tgz

colabを使って2クラスの画像分類をCNNで行います。
/content/Oxford-IIIT-Pet-Dataset-Birman--chihuahua/のサブディレクトリtrain/とtest/に入っているのは訓練データとテストデータです。それぞれのBirman/とchihuahua/という2つのサブディレクトリにはそれぞれクラスBirmanとクラスchihuahuaのデータが入っています。すでに150x150ピクセルに正規化されています。この状態で、次のステップに沿って画像分類タスクを行なうコードを書いて下さい。
1. CNNによる2クラス画像分類の適切なモデルを設計します。できるだけ精度が高いモデルにして下さい。モデルは.keras形式で保存して下さい。
2. モデルを訓練データで訓練します。訓練時には、その進み具合をリアルタイムで確認できるように、適切な表示を行うようにして下さい。各種パラメーターは適切と考えられる値に設定して下さい。GPUを利用して下さい。
3. テストデータによりモデルの性能を測定し、結果を表にして表示して下さい。

import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import matplotlib.pyplot as plt
import pandas as pd

# GPUが利用可能か確認
print("Num GPUs Available: ", len(tf.config.experimental.list_physical_devices('GPU')))

Num GPUs Available:  0

def create_cnn_model(input_shape=(150, 150, 3)):
    model = models.Sequential([
        # 畳み込み層とプーリング層
        layers.Conv2D(32, (3, 3), activation='relu', input_shape=input_shape),
        layers.MaxPooling2D((2, 2)),
        
        layers.Conv2D(64, (3, 3), activation='relu'),
        layers.MaxPooling2D((2, 2)),
        
        layers.Conv2D(128, (3, 3), activation='relu'),
        layers.MaxPooling2D((2, 2)),
        
        layers.Flatten(),  # 全結合層のための平坦化
        layers.Dense(128, activation='relu'),
        layers.Dropout(0.5),  # 過学習を防ぐためのドロップアウト
        layers.Dense(1, activation='sigmoid')  # 2クラス分類のためのシグモイド活性化
    ])
    
    # コンパイル
    model.compile(optimizer='adam',
                  loss='binary_crossentropy',
                  metrics=['accuracy'])
    return model

# モデルの作成
model = create_cnn_model()
model.summary()

M:\Documents\pkgs\Python311\site-packages\keras\src\layers\convolutional\base_conv.py:107: UserWarning: Do not pass an `input_shape`/`input_dim` argument to a layer. When using Sequential models, prefer using an `Input(shape)` object as the first layer in the model instead.
  super().__init__(activity_regularizer=activity_regularizer, **kwargs)

Model: "sequential"

┏━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━━━━━━━━━━━━━┓
┃ Layer (type)                         ┃ Output Shape                ┃         Param # ┃
┡━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╇━━━━━━━━━━━━━━━━━┩
│ conv2d (Conv2D)                      │ (None, 148, 148, 32)        │             896 │
├──────────────────────────────────────┼─────────────────────────────┼─────────────────┤
│ max_pooling2d (MaxPooling2D)         │ (None, 74, 74, 32)          │               0 │
├──────────────────────────────────────┼─────────────────────────────┼─────────────────┤
│ conv2d_1 (Conv2D)                    │ (None, 72, 72, 64)          │          18,496 │
├──────────────────────────────────────┼─────────────────────────────┼─────────────────┤
│ max_pooling2d_1 (MaxPooling2D)       │ (None, 36, 36, 64)          │               0 │
├──────────────────────────────────────┼─────────────────────────────┼─────────────────┤
│ conv2d_2 (Conv2D)                    │ (None, 34, 34, 128)         │          73,856 │
├──────────────────────────────────────┼─────────────────────────────┼─────────────────┤
│ max_pooling2d_2 (MaxPooling2D)       │ (None, 17, 17, 128)         │               0 │
├──────────────────────────────────────┼─────────────────────────────┼─────────────────┤
│ flatten (Flatten)                    │ (None, 36992)               │               0 │
├──────────────────────────────────────┼─────────────────────────────┼─────────────────┤
│ dense (Dense)                        │ (None, 128)                 │       4,735,104 │
├──────────────────────────────────────┼─────────────────────────────┼─────────────────┤
│ dropout (Dropout)                    │ (None, 128)                 │               0 │
├──────────────────────────────────────┼─────────────────────────────┼─────────────────┤
│ dense_1 (Dense)                      │ (None, 1)                   │             129 │
└──────────────────────────────────────┴─────────────────────────────┴─────────────────┘

 Total params: 4,828,481 (18.42 MB)

 Trainable params: 4,828,481 (18.42 MB)

 Non-trainable params: 0 (0.00 B)

# データのディレクトリ
train_dir = '/content/Oxford-IIIT-Pet-Dataset-Birman--chihuahua/train'
test_dir = '/content/Oxford-IIIT-Pet-Dataset-Birman--chihuahua/test'

# データジェネレーター
train_datagen = ImageDataGenerator(rescale=1.0/255.0)
test_datagen = ImageDataGenerator(rescale=1.0/255.0)

# 訓練データジェネレーター
train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(150, 150),
    batch_size=32,
    class_mode='binary')

# テストデータジェネレーター
test_generator = test_datagen.flow_from_directory(
    test_dir,
    target_size=(150, 150),
    batch_size=32,
    class_mode='binary')

Found 378 images belonging to 2 classes.
Found 22 images belonging to 2 classes.

# 訓練
history = model.fit(
    train_generator,
    steps_per_epoch=train_generator.samples // train_generator.batch_size,
    epochs=20,  # 適切なエポック数を指定
    validation_data=test_generator,
    validation_steps=test_generator.samples // test_generator.batch_size
)

Epoch 1/20

M:\Documents\pkgs\Python311\site-packages\keras\src\trainers\data_adapters\py_dataset_adapter.py:121: UserWarning: Your `PyDataset` class should call `super().__init__(**kwargs)` in its constructor. `**kwargs` can include `workers`, `use_multiprocessing`, `max_queue_size`. Do not pass these arguments to `fit()`, as they will be ignored.
  self._warn_if_super_not_called()

11/11 ━━━━━━━━━━━━━━━━━━━━ 6s 347ms/step - accuracy: 0.5240 - loss: 0.9418 - val_accuracy: 0.5000 - val_loss: 0.6882
Epoch 2/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 0s 12ms/step - accuracy: 0.3438 - loss: 0.7086 - val_accuracy: 0.5909 - val_loss: 0.6860
Epoch 3/20

M:\Documents\pkgs\Python311\site-packages\keras\src\trainers\epoch_iterator.py:107: UserWarning: Your input ran out of data; interrupting training. Make sure that your dataset or generator can generate at least `steps_per_epoch * epochs` batches. You may need to use the `.repeat()` function when building your dataset.
  self._interrupted_warning()

11/11 ━━━━━━━━━━━━━━━━━━━━ 3s 297ms/step - accuracy: 0.5986 - loss: 0.6894 - val_accuracy: 0.5000 - val_loss: 0.6918
Epoch 4/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 0s 11ms/step - accuracy: 0.5312 - loss: 0.6694 - val_accuracy: 0.5000 - val_loss: 0.6898
Epoch 5/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 3s 288ms/step - accuracy: 0.6082 - loss: 0.6750 - val_accuracy: 0.5909 - val_loss: 0.6780
Epoch 6/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 1s 12ms/step - accuracy: 0.7188 - loss: 0.6311 - val_accuracy: 0.6364 - val_loss: 0.6688
Epoch 7/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 3s 284ms/step - accuracy: 0.7038 - loss: 0.5963 - val_accuracy: 0.6364 - val_loss: 0.6181
Epoch 8/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 0s 13ms/step - accuracy: 0.8125 - loss: 0.4968 - val_accuracy: 0.6364 - val_loss: 0.6097
Epoch 9/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 3s 294ms/step - accuracy: 0.7508 - loss: 0.5382 - val_accuracy: 0.6818 - val_loss: 0.5941
Epoch 10/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 0s 12ms/step - accuracy: 0.7812 - loss: 0.4823 - val_accuracy: 0.6364 - val_loss: 0.6164
Epoch 11/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 3s 292ms/step - accuracy: 0.7868 - loss: 0.4761 - val_accuracy: 0.7727 - val_loss: 0.5360
Epoch 12/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 0s 12ms/step - accuracy: 0.8846 - loss: 0.3530 - val_accuracy: 0.7727 - val_loss: 0.5026
Epoch 13/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 3s 298ms/step - accuracy: 0.8129 - loss: 0.4102 - val_accuracy: 0.7727 - val_loss: 0.3689
Epoch 14/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 0s 13ms/step - accuracy: 0.9062 - loss: 0.2307 - val_accuracy: 0.7727 - val_loss: 0.3738
Epoch 15/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 3s 303ms/step - accuracy: 0.8720 - loss: 0.3289 - val_accuracy: 0.7727 - val_loss: 0.6224
Epoch 16/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 0s 12ms/step - accuracy: 0.8438 - loss: 0.3013 - val_accuracy: 0.7273 - val_loss: 0.5058
Epoch 17/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 3s 287ms/step - accuracy: 0.8809 - loss: 0.2595 - val_accuracy: 0.8182 - val_loss: 0.4904
Epoch 18/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 0s 13ms/step - accuracy: 0.8750 - loss: 0.2567 - val_accuracy: 0.7727 - val_loss: 0.5360
Epoch 19/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 3s 295ms/step - accuracy: 0.9194 - loss: 0.2384 - val_accuracy: 0.7727 - val_loss: 0.6230
Epoch 20/20
11/11 ━━━━━━━━━━━━━━━━━━━━ 0s 11ms/step - accuracy: 0.9375 - loss: 0.2417 - val_accuracy: 0.8182 - val_loss: 0.5479

# 訓練の精度と損失をプロット
plt.plot(history.history['accuracy'], label='Train Accuracy')
plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
plt.title('Model Accuracy')
plt.xlabel('Epochs')
plt.ylabel('Accuracy')
plt.legend()
plt.show()

plt.plot(history.history['loss'], label='Train Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Model Loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

# テストデータに対する評価
test_loss, test_accuracy = model.evaluate(test_generator)

# 結果を表示
results = pd.DataFrame({
    "Metric": ["Loss", "Accuracy"],
    "Value": [test_loss, test_accuracy]
})
print(results)

1/1 ━━━━━━━━━━━━━━━━━━━━ 0s 128ms/step - accuracy: 0.8182 - loss: 0.5479
     Metric     Value
0      Loss  0.547928
1  Accuracy  0.818182

# モデルを保存
model.save('/content/oxford_pet_model.keras')
print("Model saved as oxford_pet_model.keras")

Model saved as oxford_pet_model.keras

ニューラルネットワークによる画像のクラス分類の簡易的演習¶

1. Google Colaboratoryの準備¶

2. ChatGPTによりコードを生成する¶

3. 生成されたコードをColabで実行する¶

ステップ 1: ライブラリのインポート¶

ステップ 2: GPUの確認¶

ステップ 3: CNNモデルの設計¶

ステップ 4: 訓練データとテストデータの準備¶

ステップ 5: モデルの訓練¶

ステップ 6: 訓練の可視化¶

ステップ 7: テストデータによる性能評価¶

ステップ 8: モデルの保存¶

コードの概要¶

4. 演習内容の理解について¶

4.1 とりあえず理解して欲しいこと¶

4.2 以上の演習で何を行ったのか¶

1. ニューラルネットワーク（NN）の基本¶

2. CNN（畳み込みニューラルネットワーク）の役割¶

3. 逆伝播（バックプロパゲーション）¶

大筋でのコードの流れ¶

詳細な説明¶

1. モデルの設計¶

2. 訓練データとテストデータの準備¶

3. モデルの訓練¶

4. テストデータでの評価¶

5. モデルの保存¶

結論¶