クロの制作日記

小ネタ

scikit-learnでデータをTrain・Test・Varidationに分割する方法

機械学習においてデータをTrain(学習)・Test(テスト)・Validation(検証)データに分割したい場合があると思いますが、scikit-learnの関数にはTrainとTestデータに分割するtrain_test_split()しかありません。言うてもそんなに難しい処理ではないので自分でコ…

C++で数字の文字列(区切り文字つき)をsplitする関数

最初に 某プログラムスキルチェックサイトで「3 19 2」のような、空白で数字が区切られている文字列が入力されることがありました。そんな場合でも各々の数字をint型として取得する関数を作成しましたので共有します。C++初心者ですので、あまりよろしくない…

Linuxでユーザー追加・グループ作成・グループに追加の流れ

はじめに 私の所属している研究室では一つのサーバを複数人で共有して使っています。なので、研究室に学生が新しく入ったときに、サーバに人数分のユーザーを作成する必要があります。また、うちの研究室では他の人とファイルを共有するために、全員を同じグ…

numpy.linalg.LinAlgError: Last 2 dimensions of the array must be squareが起きる理由

研究室の後輩向けにpythonを用いた機械学習の講習を行っていたときに上記のエラーが起きたので、対処方法をエラー原因ごとに紹介します。

Gitでまとめて「git rm」 ・ 「git add」する方法

はじめに 大量にファイルやディレクトリを追加したり消去したりしたときに、ファイルごと、ディレクトリごとに一々「git add」とか「git rm」するのは面倒です。そこで、そういったことをまとめて処理するコマンドを記載しておきます。 コマンド まとめて「g…

pythonのリストとnumpyのappendの速度比較

はじめに pythonで機械学習を行う際に、行列を作成するだとか、計算した重みや予測値を保存するだとかで、配列にappendすることが多いと思います。そこで気になるのが、リストのappendとnumpyのnp.appendで速度の違いがあるのかということです。