Telegram bot to monitor and control deep learning experiments
- python-telegram-bot
- Keras (선택사항, 케라스 콜백 사용시)
- matplotlib (선택사항, convergence plots 전송시)
- Python 3.6.6
- Tensorflow 1.12.0
- Keras 2.2.4
- Ubuntu 18.04
(tfKeras) founder@hilbert:~/tfKeras/telegrad$ python3 -V
Python 3.6.6
(tfKeras) founder@hilbert:~/tfKeras/telegrad$ python -c 'import keras; print(keras.__version__)'
Using TensorFlow backend.
(tfKeras) founder@hilbert:~/tfKeras/telegrad$ python -c 'import tensorflow as tf; print(tf.__version__)'
(tfKeras) founder@hilbert:~/tfKeras/telegrad$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 18.04.1 LTS
Release: 18.04
Codename: bionic
자동으로 해당 봇과 통신하도록 케라스 콜백을 사용할 수도 있고, 또는 커스토마이징을 할 수도 있다. 주의할 점은 일단 여러분이 앱에서 /start 메시지를 보낸 후에 봇은 작동한다는 점이다.
# Telegram Bot imports
from dl_bot import DLBot
from telegram_bot_callback import TelegramBotCallback
telegram_token = "TOKEN" # replace TOKEN with your bot's token
# user id is optional, however highly recommended as it limits the access to you alone.
telegram_user_id = None # replace None with your telegram user id (integer):
# Create a DLBot instance
bot = DLBot(token=telegram_token, user_id=telegram_user_id)
# Create a TelegramBotCallback instance
telegram_callback = TelegramBotCallback(bot) 을 예제로 사용하는 경우 위의 코드로 충분하다. 이 상태로 실행하면 다음과 같다.
먼저 /start 라는 메시지를 전송한다. 사용가능한 명령어들을 보여주게 된다.
봇은 다음과 같이 훈련 상태를 전송하게 된다.
훈련을 중단할 경우에는 /stoptraining 이라고 입력하면 그만둘지 여부를 다음과 같이 물어오게 된다.
위의 샘플이 아니라 기존 훈련에 적용할려면 다음과 같이 적용할 수 있다. 먼저 위와 마찬가지로 텔레그램 봇을 가져오고, 인스턴스를 생성한 뒤 다음과 같이 telegram_callback 을 으로 전달되는 콜백 리스트에 포함시키면 된다., y_train,
validation_data=(x_test, y_test),
이게 전부다. 실제로 적용해보자. 하단 코드는 다음 코드의 일부다.
먼저 텔레그램 봇을 가져온다. token 정보와 사용자 아이디를 수정한 뒤, 콜백 리스트에 telegram_callback 을 추가하고 훈련을 진행한다.
# Telegram Bot imports
from dl_bot import DLBot
from telegram_bot_callback import TelegramBotCallback
telegram_token = "1215646465:DHKDIHGAJGO4G4GD4G46G4" # replace TOKEN with your bot's token
# user id is optional, however highly recommended as it limits the access to you alone.
telegram_user_id = 484946464 # replace None with your telegram user id (integer):
# Create a DLBot instance
bot = DLBot(token=telegram_token, user_id=telegram_user_id)
# Create a TelegramBotCallback instance
telegram_callback = TelegramBotCallback(bot)
from IPython.display import display
from PIL import Image
steps_per_epoch = 8000,
epochs = 20,
validation_data = test_set,
validation_steps = 800,
callbacks = [telegram_callback])
다음과 같이 훈련이 진행되고 있다.
Epoch 1/20 8000/8000 [==============================] - 4012s 501ms/step - loss: 0.4469 - acc: 0.7836 - val_loss: 0.5881 - val_acc: 0.7722 Send message failed, user did not send /start Epoch 2/20 8000/8000 [==============================] - 3978s 497ms/step - loss: 0.2619 - acc: 0.8869 - val_loss: 0.8386 - val_acc: 0.7647 Epoch 3/20 8000/8000 [==============================] - 3993s 499ms/step - loss: 0.1642 - acc: 0.9346 - val_loss: 1.0561 - val_acc: 0.7585 Epoch 4/20 5254/8000 [==================>...........] - ETA: 21:45 - loss: 0.1166 - acc: 0.9558
텔레그램을 통해 메시지가 정상적으로 전송되는지 확인해보자.
먼저 /start 메시지를 전송한다.
잠시 후 첫번째 에포크에 대한 정보가 전송된다. /plot 메시지를 통해 그래프로도 확인가능하다. /getlr 은 현재 학습률을 물어보는 명령어이다. /status 메시지를 통해서는 현재 상황을 받아볼 수 있다.
