DeepSeek Está Em Alta. A Mania Da Ia Pode Voltar A Subir?
Tempo de atualização: fev 10, 2025 Leitores: 41
Nos últimos tempos, o DeepSeek tem sido, sem dúvida, o foco dos focos da ciência e da tecnologia. Lançado pela deepin, uma startup de inteligência artificial da phantom square, o modelo AI big chegou ao topo da lista de downloads globais em várias lojas de aplicativos. A explosão do DeepSeek também acendeu o entusiasmo do mercado de capitais. Desde a abertura do mercado após o festival de primavera, o conceito de DeepSeek, a computação em nuvem e outros índices avançaram muito, com aumentos superiores a 10%. O setor de computadores e mídia também está na frente da indústria de primeira classe da citic.
O avanço de DeepSeek foi principalmente em termos de baixo custo e capacidade de raciocínio. O modelo V3 fez um progresso significativo no custo de treinamento e eficiência computacional, enquanto o modelo R1 foi pionário em uma nova abordagem para modelos de inferência de treinamento. Através de otimização de engenharia como FP8, MoE, MLA e PTX, ele não só maximiza a utilização de recursos de força computacional e reduz significativamente os custos (por exemplo, seu custo de treinamento é apenas 1/30 de modelos similares do OpenAI), Além disso, destaca-se nas tarefas de matemática, código e raciocínio em linguagem natural, com desempenho superior ao OpenAI o1.
Antes do modelo DeepSeek-r1, os grandes modelos da indústria usavam o RLHF (Reinforcement Learning from HumanFeedback, aprendizado por reforço baseado em feedback humano), que usava um grande número de perguntas e respostas de alta qualidade escritas por humanos para entender "o que é uma boa resposta", É como ter um professor a guiar a resolução do problema. Esta abordagem, embora eficaz, tem gargalos. O modelo R1 abandonou drasticamente a parte HF (feedback humano) da RLHF, deixando apenas a pura RL (aprendizagem por reforço), o que equivale a deixar de depender da orientação do professor e, em vez disso, fazer as suas próprias mãos e aprender através de tentativas e erros constantes.
Especificamente, o modelo de aprendizagem por reforço do modelo R1 define duas "funções de recompensa" :
Função resultado correto: sempre que uma resposta correta é encontrada, uma recompensa é dada a si mesmo. Esta resposta é validada por uma ferramenta externa, garantindo que está realmente correta.
Função do processo de pensamento: mesmo que a resposta não esteja completamente correta, desde que o processo de raciocínio seja lógico e claro e os passos sejam razoáveis, ele se dará uma recompensa. É como resolver um problema, embora a resposta final não esteja correta, mas a linha de pensamento é ótima e merece ser encorajada.
Desta forma, o modelo R1 tenta continuamente diferentes métodos de resolução de problemas e, em seguida, avalia seu desempenho de acordo com essas duas regras de recompensa. Eventualmente, aprende quais métodos são mais eficazes e quais etapas de raciocínio são mais razoáveis. Eventualmente, ele se torna cada vez mais inteligente e aumenta sua capacidade de raciocínio. O mais importante é que o modelo R1 não precisa de uma grande quantidade de dados de anotação neste processo, mas aumenta a capacidade através da auto-aprendizagem e otimização. Ao mesmo tempo, a implementação de código aberto do modelo de igualdade, encurtando a lacuna tecnológica entre o modelo de código aberto e o modelo de fonte fechada, e também encurtando a lacuna tecnológica entre a inteligência artificial chinesa e americana.
Para esta ronda de ofertas de ia e potenciais oportunidades futuras, o DeepSeek quente significa que o desenvolvimento futuro do campo global de ia pode ser mais plural. Ao mesmo tempo, espera-se que a grande redução do modelo acelera a formação de um circuito fechado de comercialização no final da aplicação de ia. O DeepSeek espera acelerar a aterragem de aplicações de inteligência artificial, impulsionando o crescimento explosivo da demanda por força computacional no pós-treinamento e raciocínio. A estrutura posterior da placa de força computacional na proporção de demanda final de raciocínio é esperado para aumentar ainda mais, para o chip de força computacional de raciocínio, a formação de força de cálculo final é bom.
Por outro lado, os modelos operacionais das startups de ia experimentarão uma mudança: as empresas de ia que dependem de clusters de gpus caros podem estar em risco de falência devido a desvantagens de custo. Isso levará a um grande aumento na oferta de gpus no mercado de segunda mão, enquanto as empresas de ia de pequeno e médio porte são mais propensos a adquirir gpus de gama baixa, que são mais baratos. Os requisitos de hardware também sofrerão uma transformação estrutural: desde o ano passado, os requisitos de força computacional orientados para a formação começaram a mudar para o lado do raciocínio. No futuro, espera-se que esta tendência continue. Muitas pequenas e médias empresas de ia não se dedicarão mais a treinar modelos básicos e, em vez disso, adotarão modelos de código aberto como o DeepSeek. Além disso, é provável que a posição dominante da nvidia no mercado da formação seja reavaliada.
-
Página anterior
Contagem regressiva! ExcessChip Technology Limited no Evento de Eletrônica de Munique, desbloqueando novas oportunidades para transformar bilhões de materiais ociosos em valor.
A ExcessChip Technology oferece soluções completas para inventários eletrônicos inativos, ajudando as empresas a recuperar fundos e otimizar suas cadeias de suprimentos. Junte-se a nós na Feira de Eletrônica de Munique Xangai 2025, no estande N2-608, para explorar nossos serviços....
Tempo de atualização: fev 27, 2025
-
Próxima página
Huawei anuncia decisão importante! Os novos produtos da Huawei serão totalmente equipados com Harmony nativo em 2025
De acordo com notícias oficiais da Huawei, em 2025, todos os novos celulares, tablets e produtos vestíveis da Huawei serão equipados com o sistema operacional nativo Harmony por padrão quando saírem da fábrica, e cada vez mais produtos antigos concluirão gradualmente a atualização para o s...
Tempo de atualização: jan 04, 2025