Aprendizado de máquina para capacitar a pesquisa
A inteligência artificial, ou aprendizado de máquina, pode oferecer suporte a análises complexas e promover pesquisas de qualidade, mas somente quando usado com cuidado. John F. Wu compartilha conselhos sobre como o aprendizado de máquina pode capacitar os pesquisadores
você pode gostar
Recursos populares
A inteligência artificial (IA) – ou aprendizado de máquina – parece estar em toda parte atualmente. Se você é um pesquisador, provavelmente já viu esses termos aparecerem cada vez mais na literatura acadêmica de sua área. Mas quanto disso é realmente útil? Você também deveria estar aproveitando o aprendizado de máquina?
Neste artigo, descreverei alguns casos em que o aprendizado de máquina é útil para pesquisa – e também quando não é – inspirando-me em meu próprio campo da astronomia.
O aprendizado de máquina oferece o maior valor para problemas de pesquisa "orientados por dados": quando você tem tantos dados que não pode inspecioná-los manualmente. Nesses cenários, o aprendizado de máquina pode aliviar sua carga de trabalho e permitir que você se concentre em sua área de pesquisa. No entanto, a adoção do aprendizado de máquina tem suas armadilhas e custos ocultos.
Quando aplicado com cuidado, através das lentes de um cético, o aprendizado de máquina pode permitir programas de pesquisa que de outra forma seriam inviáveis. De um modo geral, o aprendizado de máquina pode capacitar os pesquisadores de quatro maneiras.
Às vezes, você deseja saber se seu conjunto de dados pode ser usado para determinar outra coisa. Por exemplo, você pode ter ouvido falar sobre como o aprendizado de máquina na medicina pode ajudar os médicos a rastrear o câncer. No meu campo da astronomia, é bastante simples obter imagens de milhões de galáxias, mas tradicionalmente precisamos obter e analisar observações especializadas para entender os detalhes de como as galáxias evoluem. Usando aprendizado de máquina, meus colaboradores e eu descobrimos que poderíamos realmente estudar essas galáxias apenas usando imagens.
É fácil criar novos modelos de como as coisas devem se comportar, mas o verdadeiro teste de qualquer modelo é se ele tem algum poder preditivo. Ao identificar conexões em seus dados, você pode formular um modelo – e o aprendizado de máquina também. Os cientistas usaram o aprendizado de máquina para resumir essas conexões na linguagem da matemática e descobrir uma nova fórmula que explica a distribuição da matéria em escalas cósmicas.
Se o aprendizado de máquina pode ser usado para encontrar as tendências típicas, talvez não seja surpreendente que o aprendizado de máquina também seja ótimo em detectar coisas anômalas. Muitos campos de pesquisa podem se beneficiar de um estudo completoinvestigação de fenômenos raros e o aprendizado de máquina podem ajudá-lo a identificar a "agulha no palheiro".Na astronomia, o aprendizado de máquina também foi usado para detectar fenômenos raros, como ondas gravitacionaiseventos, supernovas, galáxias com lentes gravitacionais, dados processados incorretamente e muito mais. Uma análise de galáxias atípicas encontrou muitos fenômenos interessantes(incluindo muitas "galáxias" que não eram galáxias).
Sejamos honestos: alguns aspectos da pesquisa são chatos e demorados. Na radioastronomia, são necessários vastos recursos computacionais e muito tempo para remover sinais artificiais e dados corrompidos. O aprendizado de máquina pode executar essas tarefas usando uma fração do custo e do tempo.
Ao acelerar as partes chatas da pesquisa, o aprendizado de máquina também pode permitir novos tipos de análises que de outra forma não seriam possíveis. Muitos problemas de pesquisa tentam abordar o seguinte problema: dado um resultado observado, quais são os parâmetros para um modelo que produziu tal resultado? Esses chamados problemas inversos podem ser resolvidos de forma eficiente usando aprendizado de máquina. Para obter mais detalhes, leia sobre inferência baseada em simulação.
Os conjuntos de dados estão crescendo cada vez mais, mas há muitas maneiras de combinar recursos em versões condensadas. Os métodos de redução de dimensionalidade incluem abordagens clássicas, como Análise de Componentes Principais (PCA), Incorporação Estocástica de Vizinhos T-distribuídos (t-SNE) e Aproximação e Projeção de Manifold Uniforme (UMAP), ou técnicas de aprendizado de máquina, como o uso de redes neurais pré-treinadas ou similares algoritmos para transformar os dados em versões resumidas.