実践ケモインフォマティクス

〜主にケモインフォマティクス, 個人的備忘録, 理論より実践重視〜

化合物の記述子化まとめ

はじめに 化合物の構造情報から生成できる変数(記述子)のまとめ 前準備 使用するデータ 1290分子の水溶解度(LogS)データ(sdfファイル形式)の内、20分子を使用 (金子研究室HPのデータセットから取得) モジュールのインストール conda install -c cond…

化合物の溶解度予測(予測の信頼性も評価する)

はじめに 化合物の溶解度予測(基礎編)をベースにして、今回は予測の信頼性(=予測値の分散=予測値がどれだけ不安定か)も合わせて評価する。 目的 分子の水溶解度(LogS)の予測および、予測値の分散を求める。 諸条件 データ 100分子の水溶解度(LogS)デ…

Tips(解析関係)

(20'/12/13 更新) クロスバリデーションの分割数 1000 サンプル以上 : 2-fold クロスバリデーション 1000 から 100 くらいまで : 5-fold クロスバリデーション 100 から 30 くらいまで : 10-fold クロスバリデーション 30 以下 : leave-one-out クロスバリ…

化合物の溶解度予測(基本編)

はじめに 化合物の構造情報を入力値として、その物性を予測する。 本解析手順をベースとして、今後様々な解析オプション、テクニックを足していく。 目的 分子の水溶解度(LogS)を予測すること 諸条件 データ 1290分子の水溶解度(LogS)データ(sdfファイ…

pubchem から化合物情報を一気に取得する

目的 化合物の基本的な情報(化合物名やCASなど)から、その化合物の情報(カノニカルSMILESや、分子量などの基本的な記述子)を取得する。 (SMILES情報があれば記述子を計算→化合物の物性予測の変数として使用できるが、SMILESを収集するのが面倒なので自…

外部データベースのまとめ(ケモインフォマティクス )

主にケモインフォマティクスで活用できそうな外部データベースのまとめ。 API利用などで一括取得が可能 Pubchem 化合物のデータベース。(APIを使った自動取得が可能) (参考:pubchem から化合物情報を一気に取得する) ChemSpider 化合物のデータベース。(AP…

〇〇インフォマティクス勉強のためのおすすめHPメモ

はじめに マテリアルインフォマティクスを進めるための情報収集・勉強のためのHPのまとめ (2020/11/7 更新) ケモインフォマティクス関連 明治大学金子研究室HP 一般的なデータ解析の流れ、予測モデルの紹介から、データ解析での化合物の取り扱い、解析のノ…