Skip to content

Course completion work defended and approved at the Faculdade de Computação (FACOMP) of the Instituto de Ciências Exatas e Naturais (ICEN) of the Universidade Federal do Pará (UFPa).

License

Notifications You must be signed in to change notification settings

imatheussm/undergraduation-completion-work

Repository files navigation

undergraduation-completion-work

Undergraduation completion work defended and approved at the Faculdade de Computação (FACOMP) of the Instituto de Ciências Exatas e Naturais (ICEN) of the Universidade Federal do Pará (UFPa).

See manuscript

Basic information

  • Course: bachelor's degree in computer science
  • Defense date: February 21st, 2022 @ 10:30 AM.
  • Title: On Reducing the Dimensionality of Small Molecule Data for Visual-Exploratory Analysis in Human Intestinal Absorption Prediction

Abstract

English

Oral bioavailability is a desirable property in drug development. Virtual screening of compounds according to their properties with computational intelligence can accelerate the prediction of their human intestinal absorption (HIA). Despite the existence of studies aimed at predicting HIA of compounds, dimensionality reduction (DR) techniques that extract features are seldom employed to enable visual-exploratory analyses and pre-process data for machine learning (ML) algorithms. This work applies six DR projectors (ivis, KPCA, PCA, PCS, TSVD, and UMAP) to produce two- and three-dimensional projections alongside four ML classifiers (KNN, MLP, RF, and SVM) in predicting HIA of small molecules, an effort that encompassed the analysis of fifty-two pipelines. Results demonstrate that, despite reducing the dimensionality by more than 98%, DR-encompassing pipelines still delivered competitive results while also facilitating visualization, demonstrating the viability and potential of DR via feature extraction as an automated pre-processing step.

Keywords: chemoinformatics, computational pharmaceutics, dimensionality reduction, drug discovery and development, feature extraction, human intestinal absorption, machine learning.

Portuguese

Biodisponibilidade oral é uma propriedade desejável no desenvolvimento de drogas. A triagem virtual de compostos de acordo com suas propriedades com inteligência computacional pode acelerar a predição de sua absorção intestinal humana (HIA). A despeito da existência de estudos almejando predizer a HIA de compostos, técnicas de redução de dimensionalidade (DR) que extraem características são raramente empregadas para possibilitar análises visual-exploratórias e pré-processar dados para algoritmos de aprendizado de máquina (ML). Este trabalho aplica seis projetores de DR (ivis, KPCA, PCA, PCS, TSVD e UMAP) para produzir projeções bi e tridimensionais conjuntamente com quatro classificadores de ML (KNN, MLP, RF e SVM) na predição de HIA de pequenas moléculas, um esforço que englobou a análise de cinquenta e dois pipelines. Os resultados demonstram que, a despeito de reduzir a dimensionalidade em mais de 98%, os pipelines envolvendo DR ainda apresentaram resultados competitivos enquanto também facilitaram a visualização, demonstrando a viabilidade e o potencial de técnicas de DR via extração de características como uma etapa automatizada de pré-processamento.

Palavras-chave: quimioinformática, farmacêutica computacional, redução de dimensionalidade, descoberta e desenvolvimento de drogas, extração de características, absorção intestinal humana, aprendizado de máquina.

Evaluation board

  • Supervisor: Prof. Claudomiro de Souza de Sales Júnior, Ph.D.
  • Co-supervisor: Ewerton Christian Lima de Oliveira, Ing. M.Sc.
  • Evaluators:
    • Prof. Regiane Silva Kawasaki Francês, Ph.D.
    • Prof. Reginaldo Cordeiro dos Santos Filho, Ph.D.
    • Prof. Kauê Santana da Costa, Ph.D.
    • Caio Marcos Flexa Rodrigues, Ph.D.

About

Course completion work defended and approved at the Faculdade de Computação (FACOMP) of the Instituto de Ciências Exatas e Naturais (ICEN) of the Universidade Federal do Pará (UFPa).

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published