banner
Lar / Notícias / Aprendizado de máquina muito caro para arquivos do estado
Notícias

Aprendizado de máquina muito caro para arquivos do estado

Jan 19, 2024Jan 19, 2024

Eu olhei para_Mis/Getty Images

Assine a nossa newsletter

Permaneça conectado

porChris Teale

Tendo inicialmente planejado usar o aprendizado de máquina para ajudar os arquivistas a classificar uma grande quantidade de dados, o Oregon State Archives, em vez disso, implantará análises avançadas de dados em meio a preocupações com o custo e a maturidade da tecnologia ML.

Funcionários de arquivos no final do ano passado divulgaram um pedido de propostas pedindo a tecnologia ML para ajudar a processar dados, removendo duplicatas e quaisquer itens que não sejam pertinentes, enquanto os indexa para facilitar o acesso futuro. A RFP foi motivada pela saída da ex-governadora Kate Brown do cargo e a esperada transmissão aos arquivos do estado de até 10 terabytes de dados de seus oito anos como governadora.

Mas as respostas à RFP forçaram as autoridades a repensar, disse Kristofer Stenson, gerente de registros do estado no Oregon State Archives, durante o Nextgov e o GCN's Emerging Tech and Modernization Summit. Pelo menos uma licitação para o contrato ML teve um preço três vezes maior do que todo o orçamento bienal dos arquivos, o que Stenson descreveu como "abrir os olhos".

"Eu não diria que foi uma aquisição fracassada, pois aprendemos muito com ela", disse Stenson. Dada a necessidade de a tecnologia amadurecer ainda mais e os preços caírem, os líderes estaduais decidiram "se afastar" do ML.

Em vez disso, Stenson disse que o Oregon usará análise avançada de dados para processar os registros dos arquivos governamentais de Brown. Essa tecnologia ajudará a identificar e remover quaisquer duplicatas, bem como informações confidenciais, como números de CPF e números de telefone. Também oferece pesquisa avançada para vasculhar os arquivos.

Esse esforço, disse Stenson, é "muito mais factível no curto prazo" e dentro do orçamento atual. Outras agências do Oregon usam ferramentas de análise semelhantes, portanto, há precedentes para os arquivos que as usam por enquanto como um "trampolim" para o ML completo no futuro.

Artigos relacionados

O aprendizado de máquina vasculha os arquivos dos estados

Condado rural coloca registros de terras em blockchain

Gestão de registos eletrónicos de testes pandémicos

"Isso ainda representa um grande passo à frente para nós e, com sorte, também nos permitirá fornecer acesso mais direto a essas coleções em breve", disse Stenson.

Os arquivos também estão no meio de uma conversa sobre como armazenar os terabytes de documentos, comunicações e outros dados do mandato de Brown, que incluiu liderar a resposta do governo do estado à pandemia do COVID-19. Stenson disse que a solução provavelmente será uma abordagem híbrida com armazenamento em nuvem e no local para fornecer redundância.

Lidar com a enorme quantidade de dados eletrônicos gerados por funcionários eleitos é um problema que todos os arquivos estaduais devem enfrentar. Stenson disse que o ML em breve será uma "ferramenta crítica" para gerenciar essas informações.

"Isso é real, não é mais um sonho do céu", disse Stenson. "Este é o mundo em que vamos viver. Embora ainda não estejamos lá, estamos chegando lá muito rapidamente."

Para os funcionários de aquisições, o episódio mostrou o estado de maturidade da tecnologia de ML e o custo para os governos usá-la. Stenson disse que, embora o Oregon "possa ter se precipitado um pouco" ao pedir soluções de ML agora, é melhor pensar no futuro em tecnologias emergentes do que atrás da curva. "Prefiro estar olhando para frente do que estar cinco anos atrasado", disse ele.

PRÓXIMA HISTÓRIA:A inovação prospera quando os governos adotam parcerias público-privadas de última geração

PRÓXIMA HISTÓRIA: