English 官方微信
微信公众号

An integrated platform and meta-learner for feature engineering machine learning analysis and modeling of DNA, RNA and protein sequence data

  • 期刊名称Briefings in Bioinformatics
  • 发表年份2020
  • 全部作者
  • 访问统计
  • 添加时间2021年09月18日

论文简介:一个全面和通用的基于python的工具包,集成了特征提取、聚类、归一化、选择、降维、预测器构建、最佳描述符/模型选择、集成学习和DNA、RNA和蛋白质序列结果可视化的功能。用户只需要上传自己的数据集,并从中计算出自己需要的功能,所有必要的程序和优化设置都由软件自动完成。iLearn包括DNA、RNA和蛋白质的各种描述符,支持四种特征输出格式,以便于直接使用输出或与其他计算工具通信。总的来说,iLearn包含16种不同类型的特征聚类、选择、归一化和降维算法,以及5种常用的机器学习算法,极大地方便了特征分析和预测器构建。

原文链接:https://academic.oup.com/bib/article/21/3/1047/5475015