Aprendizado de máquina no ensino superior
Muitos de ensino superior As instituições agora estão usando dados e análises como parte integrante de seus processos. Quer o objetivo seja identificar e apoiar melhor os pontos problemáticos na jornada do aluno, alocar recursos com mais eficiência ou melhorar a experiência do aluno e do corpo docente, as instituições estão vendo os benefícios das soluções baseadas em dados.
Este artigo é um esforço colaborativo de Claudio Brasca, Nikhil Kaithwal, Charag Krishnan, Monatrice Lam, Jonathan Law e Varun Marya, representando pontos de vista da prática do setor público e social da McKinsey.
Aqueles que estão na vanguarda dessa tendência estão se concentrando em aproveitar a análise para aumentar a personalização e a flexibilidade do programa, bem como melhorar a retenção, identificando alunos em risco de abandono e alcançando proativamente com intervenções personalizadas. De fato, a ciência de dados e o aprendizado de máquina podem agregar valor significativo para as universidades, garantindo que os recursos sejam direcionados para as oportunidades de maior impacto para melhorar o acesso de mais alunos, bem como o envolvimento e a satisfação dos alunos.
Por exemplo, a Western Governors University, em Utah, está usando modelagem preditiva para melhorar a retenção, identificando alunos em risco e desenvolvendo programas de intervenção precoce. Os esforços iniciais aumentaram a taxa de graduação do programa de graduação de quatro anos da universidade em cinco pontos percentuais entre 2018 e 2020.1 "Disponível sob demanda: melhorando o sucesso do aluno com uma abordagem unificada para análise de dados e IA", Databricks, acessado em dezembro de 2021; "Sobre as taxas de graduação", Western Governors University, 2 de dezembro de 2021.
No entanto, o ensino superior ainda está nos estágios iniciais de construção de capacidade de dados. Com as universidades enfrentando muitos desafios (como pressões financeiras, o precipício demográfico e um aumento nos problemas de saúde mental dos alunos) e uma variedade de oportunidades (incluindo alcançar alunos adultos e dimensionar o aprendizado on-line), expandir o uso de análises avançadas e aprendizado de máquina pode provar benéfico.
Abaixo, compartilhamos alguns dos casos de uso mais promissores para análises avançadas no ensino superior para mostrar como as universidades estão aproveitando essas oportunidades para superar os desafios atuais, permitindo o acesso de muito mais alunos e melhorando a experiência do aluno.
A ciência de dados e o aprendizado de máquina podem gerar um valor significativo para as universidades, garantindo que os recursos sejam direcionados para as oportunidades de maior impacto para melhorar o acesso de mais alunos, bem como o envolvimento e a satisfação dos alunos.
As técnicas de análise avançada podem ajudar as instituições a obter insights significativamente mais profundos sobre suas populações estudantis e identificar riscos mais sutis do que poderiam alcançar por meio de análises descritivas e diagnósticas, que dependem de abordagens lineares baseadas em regras (Quadro 1).
A análise avançada – que usa o poder de algoritmos como aumento de gradiente e floresta aleatória – também pode ajudar as instituições a lidar com vieses inadvertidos em seus métodos existentes de identificação de alunos em risco e projetar proativamente intervenções personalizadas para mitigar a maioria dos riscos identificados.
Por exemplo, instituições que usam abordagens lineares e baseadas em regras analisam indicadores como notas baixas e baixa frequência para identificar alunos em risco de abandono escolar; as instituições então alcançam esses alunos e lançam iniciativas para melhor apoiá-los. Embora essas iniciativas possam ser úteis, muitas vezes são implementadas tarde demais e visam apenas um subconjunto da população em risco. Essa abordagem pode ser uma boa solução improvisada para dois problemas enfrentados pelos líderes de sucesso estudantil nas universidades. Em primeiro lugar, há muitas variáveis que poderiam ser analisadas para indicar risco de desgaste (como fatores acadêmicos, financeiros e de saúde mental e sentimento de pertencimento ao campus). Em segundo lugar, embora seja fácil identificar a variação notável em qualquer uma ou duas variáveis, é difícil identificar a variação nominal em múltiplas variáveis. Abordagens lineares e baseadas em regras, portanto, podem não identificar alunos que, por exemplo, podem ter notas decentes e frequência acima da média, mas que têm lutado para entregar suas tarefas no prazo ou têm dificuldade consistente em pagar suas contas (Quadro 2).