実践ケモインフォマティクス

〜主にケモインフォマティクス, 個人的備忘録, 理論より実践重視〜

個人的メモ(分析者のためのデータ解釈学入門 第三部)

(function(b,c,f,g,a,d,e){b.MoshimoAffiliateObject=a; b[a]=b[a]||function(){arguments.currentScript=c.currentScript ||c.scripts[c.scripts.length-2];(b[a].q=b[a].q||[]).push(arguments)}; c.getElementById(a)||(d=c.createElement(f),d.src=g, d.…

Tips(プログラミング関連)

matplotlib を日本語表示対応させる japanize matplotlibをインストール pip install japanize-matplotlib japanize_matplotlibをmatplotlibと共にインポートする import matplotlib.pyplot as plt import japanize_matplotlib pickle の活用 データや学習済…

個人的メモ(分析者のためのデータ解釈学入門 第二部)

分析者のためのデータ解釈学入門を読んで、自分への戒めや、知らなかったことなどに関する個人的なメモ(第二部)。 第二部では、データが与えられた後の、問題設定〜分析手法の選択までの流れ、必要な知識や考え方について述べられている。

個人的メモ(分析者のためのデータ解釈学入門 第一部)

分析者のためのデータ解釈学入門を読んで、自分への戒めや、知らなかったことなどに関する個人的なメモ(第一部)。第一部では、データの性質が分析・解釈にどう影響を与えるのか、また、それらを適切に処理する方法について述べられている

Pythonで量子化学計算(Psi4)

はじめに Psi4とは オープンソースの量子化学計算ソフトウェアで、pythonを使って動かせる。 この記事について 使い方(主にコード)は、化学の新しいカタチ、ご注文はリード化合部ですか?を参考にさせていただきました。ありがとうございました。 (詳しい…

RDkitを用いた分子構造生成2(A-B-C型)

はじめに BRICSによって生成したフラグメントを組み合わせることで新しい分子構造を生成する。(BRICSについて) 前回は、二つのフラグメント(A,B)を結合することで、A-B型の分子を生成したが、今回は、三つのフラグメント(A,B,C)を結合させることで A-B-C型…

RDkitを用いた分子構造生成1(A-B型)

はじめに BRICSによって生成したフラグメントを組み合わせることで新しい分子構造を生成する。(BRICSについて) 以前は、BRICSBuildによってランダムに構造を生成したが、今回は、二つのフラグメント(A, B)を結合させることで新たな分子(A-B)を生成する。…

BRICSBuildによる分子構造生成

はじめに BRICSによって生成したフラグメントを組み合わせることで新しい分子構造を生成する。(BRICSについて) 生成した分子群(仮想分子ライブラリー)は逆解析時の候補分子として利用可能。 このような構造生成器を Building blockタイプと呼ばれる。この…

RDkitを用いた分子操作(分子のフラグメント化)

はじめに 逆解析(分子探索)を行う際の、分子の生成に使用する部分構造(フラグメント)を準備する。 今回は、水溶解度データ(金子研究室HPのデータセット)に含まれる1290分子の構造をフラグメント化する。 検討するフラグメント手法は以下の2つ RECAP:…

RDkitを用いた分子の操作(3D構造の最適化)

前準備 モジュールのインストール conda install -c conda-forge rdkit pip install py3Dmol 分子の準備 適当な分子を準備する。 #分子の準備 mol = Chem.MolFromSmiles('CN[C@H](C)[C@H](O)c1ccccc1') #もしくは,SDFファイルの読み込みの際に,removeHs=Fals…

RDkit を用いた分子構造の操作(骨格変換)

前準備 モジュールのインストール conda install -c conda-forge rdkit データの準備 1290分子の水溶解度(LogS)データ(sdfファイル形式) (金子研究室HPのデータセットを利用) 分子構造の操作(コード) モジュールのインポート import pandas as pd im…

RDkit を用いた分子構造の描画

title: tags: ケモインフォマティクス マテリアルズインフォマティクス RDKit 分子 author: ottantachinque slide: false 前準備 モジュールのインストール conda install -c conda-forge rdkit conda install xlsxwriter 分子構造の描画 モジュールのインポ…

MI関連技術レポート再現(AIを用いたポリマー設計・検証サイクルの試行回数大幅低減:昭和電工)

はじめに 技術レポート内容 以下は、産総研の研究成果記事(2018/11/27)1より 昭和電工株式会社(社長:森川 宏平 以下、昭和電工)と国立研究開発法人 産業技術総合研究所(理事長:中鉢 良治 以下、産総研)と先端素材高速開発技術研究組合(理事長:腰塚 …

化合物の記述子化まとめ

はじめに 化合物の構造情報から生成できる変数(記述子)のまとめ 前準備 使用するデータ 1290分子の水溶解度(LogS)データ(sdfファイル形式)の内、20分子を使用 (金子研究室HPのデータセットから取得) モジュールのインストール conda install -c cond…

化合物の溶解度予測(予測の信頼性も評価する)

はじめに 化合物の溶解度予測(基礎編)をベースにして、今回は予測の信頼性(=予測値の分散=予測値がどれだけ不安定か)も合わせて評価する。 目的 分子の水溶解度(LogS)の予測および、予測値の分散を求める。 諸条件 データ 100分子の水溶解度(LogS)デ…

Tips(解析関係)

(20'/12/13 更新) クロスバリデーションの分割数 1000 サンプル以上 : 2-fold クロスバリデーション 1000 から 100 くらいまで : 5-fold クロスバリデーション 100 から 30 くらいまで : 10-fold クロスバリデーション 30 以下 : leave-one-out クロスバリ…

化合物の溶解度予測(基本編)

はじめに 化合物の構造情報を入力値として、その物性を予測する。 本解析手順をベースとして、今後様々な解析オプション、テクニックを足していく。 目的 分子の水溶解度(LogS)を予測すること 諸条件 データ 1290分子の水溶解度(LogS)データ(sdfファイ…

pubchem から化合物情報を一気に取得する

目的 化合物の基本的な情報(化合物名やCASなど)から、その化合物の情報(カノニカルSMILESや、分子量などの基本的な記述子)を取得する。 (SMILES情報があれば記述子を計算→化合物の物性予測の変数として使用できるが、SMILESを収集するのが面倒なので自…

外部データベースのまとめ(ケモインフォマティクス )

主にケモインフォマティクスで活用できそうな外部データベースのまとめ。 API利用などで一括取得が可能 Pubchem 化合物のデータベース。(APIを使った自動取得が可能) (参考:pubchem から化合物情報を一気に取得する) ChemSpider 化合物のデータベース。(AP…

〇〇インフォマティクス勉強のためのおすすめHPメモ

はじめに マテリアルインフォマティクスを進めるための情報収集・勉強のためのHPのまとめ (2020/11/7 更新) ケモインフォマティクス関連 明治大学金子研究室HP 一般的なデータ解析の流れ、予測モデルの紹介から、データ解析での化合物の取り扱い、解析のノ…