Please use this identifier to cite or link to this item: http://hdl.handle.net/123456789/7549
Title: Desenvolvimento de um modelo não linear do sucesso futuro de curto prazo de cientistas da física usando regressão simbólica
Other Titles: Development of a nonlinear model of the short-term future success of physics scientists using symbolic regression
Authors: ALMEIDA, José Vinícius Reis de
Keywords: aprendizado de máquina;
regressão simbólica;
predições científicas;
machine learning; symbolic regression; scientific predictions
Issue Date: 9-Jan-2024
Publisher: Universidade Federal do Maranhão
Abstract: Resumo: A predição do sucesso científico de curto prazo de físicos, medido pelo número de artigos com 3 citações do cientista nos próximos anos, é uma tarefa importante para diversos atores, como instituições de pesquisa, agências de fomento e empresas. Para esta tarefa, modelos de redes neurais artificiais são capazes de fornecer resultados precisos, mas são complexos e difíceis de interpretar. Modelos de regressão linear múltipla, por outro lado, são mais fáceis de interpretar, mas pressupõem que a relação entre variáveis independentes e dependentes é linear, o que nem sempre é o caso. Neste trabalho, propomos um novo modelo não linear do índice I3 futuro de físicos, baseado em regressão simbólica. O modelo foi treinado e testado com um conjunto de dados que inclui informações sobre o desempenho acadêmico, a experiência de pesquisa e as características pessoais de físicos. O modelo proposto obteve um RMSE menor que o do modelo linear, indicando que é superior em termos de precisão.__Abstract: Predicting the short-term scientific success of physicists, measured by the number of articles with 3 citations of the scientist in the next three years, is an important task for a variety of stakeholders such as research institutions, funding organizations and companies. For this task, artificial neural network models can provide accurate results, but they are complex and difficult to interpret. Multiple linear regression models, on the other hand, are easier to interpret, but they assume that the relationship between independent and dependent variables is linear, which is not always the case. In this work, we propose a new non-linear model of the future I3 index of physicists based on symbolic regression. The model was trained and tested on a dataset containing information about the academic performance, research experience and personal characteristics of physicists. The proposed model achieved a lower RMSE than the linear model, suggesting that it is superior in terms of accuracy.
URI: http://hdl.handle.net/123456789/7549
Appears in Collections:TCCs de Graduação em Ciência da Computação do Campus do Bacanga

Files in This Item:
File Description SizeFormat 
Jose_Vinicius_Reis_de_Almeida.pdfTrabalho de Conclusão de Curso1,86 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.