restructure + MLFLOW

2021-10-04 01:29:04 +03:00 · 2020-01-13 08:48:05 -06:00
parent bcdc7750e4
commit c2d962b12d
36 changed files with 87 additions and 0 deletions
--- a/environment_setup/README.md
+++ b/environment_setup/README.md
--- a/environment_setup/cuda_setup.md
+++ b/environment_setup/cuda_setup.md
--- a/machine_learning_environment/README.md
+++ b/machine_learning_environment/README.md
--- a/learning_pytorch/pytorch_gpu.py
+++ b/learning_pytorch/pytorch_gpu.py
--- a/learning_tensorflow/README.md
+++ b/learning_tensorflow/README.md
--- a/mlflow/.gitkeep
+++ b/mlflow/.gitkeep
--- a/mlflow/README.md
+++ b/mlflow/README.md
--- a/mlflow/tf_kras_mlflow_callbacks.py
+++ b/mlflow/tf_kras_mlflow_callbacks.py
@@ -0,0 +1,87 @@
+import tensorflow as tf
+import numpy as np
+import mlflow
+import os
+
+
+
+EPOCHS = 300
+BATCH = 2
+OPTIMIZER = 'adam'
+LOSS = 'mse'
+VALID_SPLIT = 0.2
+
+
+def mlflow_model_summary(my_model, path='model_summary.txt'):
+    with open(path, 'w') as fh:
+        # Pass the file handle in as a lambda function to make it callable
+        my_model.summary(print_fn=lambda x: fh.write(x + '\n'))
+    mlflow.log_artifact(path)
+    return
+
+
+class MlflowCallBacks(tf.keras.callbacks.Callback):
+
+    def __init__(self):
+        self.checkpoint_path = "model_checkpoint/"
+        # set path
+        if not os.path.isdir(self.checkpoint_path):
+            os.mkdir(self.checkpoint_path)
+        self.config_path = self.checkpoint_path + "configuration_model.json"
+
+    def on_train_begin(self, logs=None):
+        # save model configuration
+        model_json = self.model.to_json()
+        with open(self.config_path, "w") as json_file:
+            json_file.write(model_json)
+        mlflow.log_artifact(local_path=self.checkpoint_path)
+        mlflow.set_tag("Currently at epoch", 0)
+        return
+
+    def on_train_end(self, logs=None):
+        # serialize weights to HDF5
+        self.model.save_weights(self.checkpoint_path + "final_epoch_model_weights.hdf5")
+        mlflow.log_artifact(local_path=self.checkpoint_path)
+        return
+
+    def on_epoch_end(self, epoch, logs={}):
+        offset_epoch = epoch + 1
+        [mlflow.log_metric(key=name, value=value, step=offset_epoch) for name, value in logs.items()]
+        # serialize weights to HDF5
+        tmp_path = self.checkpoint_path + str(offset_epoch) + "_epoch_model_weights.hdf5"
+        self.model.save_weights(tmp_path)
+        mlflow.log_artifact(local_path=self.checkpoint_path)
+        mlflow.set_tag("Currently at epoch", offset_epoch)
+        return
+
+
+x = np.random.random((100, 3))
+y = np.random.random((100, 1))
+
+print(x.shape, y.shape)
+
+inputs = tf.keras.Input(shape=(3))
+layer = tf.keras.layers.Dense(4, activation=tf.nn.relu)(inputs)
+outputs = tf.keras.layers.Dense(1, activation=tf.nn.sigmoid)(layer)
+model = tf.keras.Model(inputs=inputs, outputs=outputs)
+
+model.compile(optimizer=OPTIMIZER, loss=LOSS)
+
+print(model.summary())
+
+
+with mlflow.start_run():
+    # log parameters
+    mlflow.log_param("epochs", EPOCHS)
+    mlflow.log_param("batch", BATCH)
+    mlflow.log_param("valid_split", VALID_SPLIT)
+    mlflow.log_param("optimizer", OPTIMIZER)
+    mlflow.log_param("loss", LOSS)
+
+    # log artifacts
+    mlflow.log_artifact("modeling.py")
+    mlflow_model_summary(my_model=model)
+
+    model.fit(x, y, validation_split=VALID_SPLIT, epochs=EPOCHS, batch_size=BATCH, callbacks=[MlflowCallBacks()])
+
+print(model.get_config())
--- a/notebooks/arxiv_scrape.ipynb
+++ b/notebooks/arxiv_scrape.ipynb
--- a/notebooks/autoencoder.ipynb
+++ b/notebooks/autoencoder.ipynb
--- a/notebooks/cat_boost.ipynb
+++ b/notebooks/cat_boost.ipynb
--- a/notebooks/catboost_gpu.ipynb
+++ b/notebooks/catboost_gpu.ipynb
--- a/notebooks/check_gpu.ipynb
+++ b/notebooks/check_gpu.ipynb
--- a/notebooks/fcn_segmentation_model.ipynb
+++ b/notebooks/fcn_segmentation_model.ipynb
--- a/notebooks/fuzzy_match_words_texts.ipynb
+++ b/notebooks/fuzzy_match_words_texts.ipynb
--- a/notebooks/kaggle_datasets.ipynb
+++ b/notebooks/kaggle_datasets.ipynb
--- a/notebooks/kera_multi_gpu.ipynb
+++ b/notebooks/kera_multi_gpu.ipynb
--- a/notebooks/keras_checkpoins.ipynb
+++ b/notebooks/keras_checkpoins.ipynb
--- a/notebooks/keras_embedding.ipynb
+++ b/notebooks/keras_embedding.ipynb
--- a/notebooks/keras_generator.ipynb
+++ b/notebooks/keras_generator.ipynb
--- a/notebooks/keras_save_load_model.ipynb
+++ b/notebooks/keras_save_load_model.ipynb
--- a/notebooks/keras_time_distribution.ipynb
+++ b/notebooks/keras_time_distribution.ipynb
--- a/notebooks/keras_tokenizer_fix.ipynb
+++ b/notebooks/keras_tokenizer_fix.ipynb
--- a/notebooks/label_encoding.ipynb
+++ b/notebooks/label_encoding.ipynb
--- a/notebooks/parallel_processing.ipynb
+++ b/notebooks/parallel_processing.ipynb
--- a/notebooks/pytorch_nn.ipynb
+++ b/notebooks/pytorch_nn.ipynb
--- a/notebooks/seq2seq_translator.ipynb
+++ b/notebooks/seq2seq_translator.ipynb
--- a/notebooks/test_mxnet.ipynb
+++ b/notebooks/test_mxnet.ipynb
--- a/notebooks/text_sum_no_generator.ipynb
+++ b/notebooks/text_sum_no_generator.ipynb
--- a/notebooks/tpot_auto_ml.ipynb
+++ b/notebooks/tpot_auto_ml.ipynb
--- a/notebooks/universal_fuzzy_word_matching.ipynb
+++ b/notebooks/universal_fuzzy_word_matching.ipynb
--- a/notebooks/universal_sentence_embedding.ipynb
+++ b/notebooks/universal_sentence_embedding.ipynb
--- a/notebooks/vanila_nn.ipynb
+++ b/notebooks/vanila_nn.ipynb
--- a/notebooks/wget_google_drive.ipynb
+++ b/notebooks/wget_google_drive.ipynb
--- a/notebooks/word_embeddings_visualize.ipynb
+++ b/notebooks/word_embeddings_visualize.ipynb
--- a/notebooks/word_sentence_similarity_transformers.ipynb
+++ b/notebooks/word_sentence_similarity_transformers.ipynb