Search

O cofundador da OpenAI, Andrej Karpathy, se junta à equipe de pré-treinamento da Anthropic

Andrej Karpathy, o pesquisador de IA que foi cofundador e trabalhou anteriormente na OpenAI e anteriormente liderou a IA na Tesla, juntou-se à Anthropic.

“Eu entrei para a Anthropic”, Karpathy postado em X Terça-feira. “Acho que os próximos anos na fronteira dos LLMs serão especialmente formativos. Estou muito entusiasmado por me juntar à equipe aqui e voltar à P&D.”

Karpathy começou esta semana na Anthropic, onde está trabalhando no pré-treinamento sob o comando do líder da equipe Nick Joseph. O pré-treinamento é responsável pelos treinamentos em larga escala que conferem a Claude seus principais conhecimentos e capacidades, segundo a empresa. É também uma das fases mais caras e de uso intensivo de computação na construção de um modelo de fronteira.

Um porta-voz da Anthropic disse ao TechCrunch que Karpathy iniciará uma equipe focada em usar Claude para acelerar a pesquisa pré-treinamento.

Karpathy é um dos poucos pesquisadores que consegue preencher a lacuna entre a teoria do LLM e a prática de treinamento em larga escala. Convocá-lo para construir tal equipe é um sinal claro da Anthropic de que acredita que a pesquisa assistida por IA, em vez da computação pura, é a forma como ela se mantém competitiva com a OpenAI e o Google.

Enquanto estava na OpenAI, Karpathy se concentrou em aprendizado profundo e visão computacional até partir em 2017 para ingressar na Tesla. Ele liderou os programas Full Self-Driving (FSD) e Autopilot da Tesla antes de partir em 2022.
Ele então voltou para a OpenAI por um ano antes de sair novamente em 2024 para iniciar Laboratórios Eurekauma startup dedicada a aplicar assistentes de IA na educação.

Karpathy não compartilhou muitas atualizações sobre o Eureka Labs desde o seu lançamento e não está claro se o renomado pesquisador continuará com a startup. Ele também ministrou um curso online chamado Redes Neurais: Zero a Herói que ajuda os alunos a aprender a construir redes neurais do zero em código, e ele tem um Canal do YouTube onde ele publica palestras semirregularmente sobre LLMs e IA.

“Continuo profundamente apaixonado pela educação e planejo retomar meu trabalho nisso a tempo”, disse Karpathy.

O TechCrunch entrou em contato com Karpathy para comentar.

Separadamente, a Antrópica também provocado Chris Rohlf à sua equipe vermelha de fronteira, que testa modelos avançados de IA contra ameaças graves. Rohlf é um veterano do setor de segurança cibernética com mais de 20 anos de experiência. Anteriormente, ele trabalhou na respeitada equipe de segurança cibernética do Yahoo, conhecida como “The Paranoids”, e mais recentemente na Meta, onde trabalhou por seis anos antes de ingressar na Anthropic. Rohlf também foi membro do Centro de Segurança e Tecnologia Emergente de Georgetown, onde trabalhou no projeto CyberAI.

“Temos diante de nós uma oportunidade real de melhorar drasticamente a segurança cibernética com IA”, disse Rohlf em um comunicado. postar no X. “Não consigo pensar em uma empresa ou equipe melhor para ingressar neste momento crítico.”

Quando você compra por meio de links em nossos artigos, podemos ganhar uma pequena comissão. Isso não afeta nossa independência editorial.



Fonte: TechCrunch