Aprendizado de máquina muito caro para arquivos do estado
Eu olhei para_Mis/Getty Images
Assine a nossa newsletter
Permaneça conectado
porChris Teale
Tendo inicialmente planejado usar o aprendizado de máquina para ajudar os arquivistas a classificar uma grande quantidade de dados, o Oregon State Archives, em vez disso, implantará análises avançadas de dados em meio a preocupações com o custo e a maturidade da tecnologia ML.
Funcionários de arquivos no final do ano passado divulgaram um pedido de propostas pedindo a tecnologia ML para ajudar a processar dados, removendo duplicatas e quaisquer itens que não sejam pertinentes, enquanto os indexa para facilitar o acesso futuro. A RFP foi motivada pela saída da ex-governadora Kate Brown do cargo e a esperada transmissão aos arquivos do estado de até 10 terabytes de dados de seus oito anos como governadora.
Mas as respostas à RFP forçaram as autoridades a repensar, disse Kristofer Stenson, gerente de registros do estado no Oregon State Archives, durante o Nextgov e o GCN's Emerging Tech and Modernization Summit. Pelo menos uma licitação para o contrato ML teve um preço três vezes maior do que todo o orçamento bienal dos arquivos, o que Stenson descreveu como "abrir os olhos".
"Eu não diria que foi uma aquisição fracassada, pois aprendemos muito com ela", disse Stenson. Dada a necessidade de a tecnologia amadurecer ainda mais e os preços caírem, os líderes estaduais decidiram "se afastar" do ML.
Em vez disso, Stenson disse que o Oregon usará análise avançada de dados para processar os registros dos arquivos governamentais de Brown. Essa tecnologia ajudará a identificar e remover quaisquer duplicatas, bem como informações confidenciais, como números de CPF e números de telefone. Também oferece pesquisa avançada para vasculhar os arquivos.
Esse esforço, disse Stenson, é "muito mais factível no curto prazo" e dentro do orçamento atual. Outras agências do Oregon usam ferramentas de análise semelhantes, portanto, há precedentes para os arquivos que as usam por enquanto como um "trampolim" para o ML completo no futuro.
Artigos relacionados
O aprendizado de máquina vasculha os arquivos dos estados
Condado rural coloca registros de terras em blockchain
Gestão de registos eletrónicos de testes pandémicos
"Isso ainda representa um grande passo à frente para nós e, com sorte, também nos permitirá fornecer acesso mais direto a essas coleções em breve", disse Stenson.
Os arquivos também estão no meio de uma conversa sobre como armazenar os terabytes de documentos, comunicações e outros dados do mandato de Brown, que incluiu liderar a resposta do governo do estado à pandemia do COVID-19. Stenson disse que a solução provavelmente será uma abordagem híbrida com armazenamento em nuvem e no local para fornecer redundância.
Lidar com a enorme quantidade de dados eletrônicos gerados por funcionários eleitos é um problema que todos os arquivos estaduais devem enfrentar. Stenson disse que o ML em breve será uma "ferramenta crítica" para gerenciar essas informações.
"Isso é real, não é mais um sonho do céu", disse Stenson. "Este é o mundo em que vamos viver. Embora ainda não estejamos lá, estamos chegando lá muito rapidamente."
Para os funcionários de aquisições, o episódio mostrou o estado de maturidade da tecnologia de ML e o custo para os governos usá-la. Stenson disse que, embora o Oregon "possa ter se precipitado um pouco" ao pedir soluções de ML agora, é melhor pensar no futuro em tecnologias emergentes do que atrás da curva. "Prefiro estar olhando para frente do que estar cinco anos atrasado", disse ele.
PRÓXIMA HISTÓRIA:A inovação prospera quando os governos adotam parcerias público-privadas de última geração
PRÓXIMA HISTÓRIA: