Trang chủ Tin tức DeepSeek AI Develop

DeepSeek AI Develop

by Harper May 25,2025

Tuy nhiên, nó vẫn rẻ hơn so với các đối thủ cạnh tranh.

Chatbot mới từ DeepSeek đã giới thiệu với tôi với mô tả hấp dẫn này:

Xin chào, tôi đã được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên.

Ngày nay, trí tuệ nhân tạo của Deepseek đã nổi lên như một đối thủ cạnh tranh đáng gờm trên thị trường, đáng chú ý là đóng góp cho một trong những khoản giảm giá cổ phiếu lớn nhất của Nvidia.

DeepSeek Test Hình ảnh: Ensigame.com

Những gì phân biệt mô hình này là kiến ​​trúc và phương pháp đào tạo sáng tạo của nó. Nó sử dụng một số công nghệ tiên tiến:

Dự đoán đa điểm (MTP): Cách tiếp cận này cho phép mô hình dự báo nhiều từ cùng một lúc bằng cách phân tích các phần khác nhau của câu, tăng cường cả độ chính xác và hiệu quả.

Hỗn hợp các chuyên gia (MOE): Mô hình của Deepseek sử dụng một loạt các mạng thần kinh đa dạng để xử lý dữ liệu đầu vào. Kiến trúc này tăng tốc độ đào tạo AI và tăng hiệu suất. Trong DeepSeek V3, 256 mạng thần kinh được sử dụng, với tám mạng được kích hoạt cho mỗi tác vụ xử lý mã thông báo.

Sự chú ý tiềm ẩn đa đầu (MLA): Cơ chế này giúp AI tập trung vào các phần quan trọng nhất của câu. Bằng cách liên tục trích xuất các chi tiết chính từ các đoạn văn bản, MLA sẽ giảm nguy cơ thiếu thông tin quan trọng, cho phép AI nắm bắt tốt hơn các sắc thái quan trọng trong dữ liệu đầu vào.

Deepseek, công ty khởi nghiệp hàng đầu của Trung Quốc tự hào rằng họ đã tạo ra một mô hình AI cạnh tranh cao với chi phí tối thiểu, tuyên bố đã chi 6 triệu đô la cho việc đào tạo DeepSeek V3 chỉ bằng cách sử dụng 2048 bộ xử lý đồ họa.

Deepseek v3 Hình ảnh: Ensigame.com

Tuy nhiên, các nhà phân tích từ Semianalysis cho thấy Deepseek vận hành một cơ sở hạ tầng tính toán đáng kể, bao gồm khoảng 50.000 GPU phễu NVIDIA. Điều này bao gồm 10.000 đơn vị H800, 10.000 H100 nâng cao và GPU H20 bổ sung. Các tài nguyên này được trải rộng trên nhiều trung tâm dữ liệu và được sử dụng để đào tạo, nghiên cứu và mô hình tài chính AI.

Tổng số tiền đầu tư của công ty vào các máy chủ là khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính khoảng 944 triệu đô la.

Deepseek là một công ty con của FLEGER FLEER HEAD FERMENT của Trung Quốc, công ty khởi nghiệp như một bộ phận tập trung AI riêng biệt vào năm 2023. Không giống như hầu hết các công ty khởi nghiệp dựa vào các nhà cung cấp đám mây, Deepseek sở hữu các trung tâm dữ liệu của mình, cung cấp toàn bộ quyền kiểm soát đối với tối ưu hóa mô hình AI và tạo ra sự đổi mới nhanh chóng. Công ty vẫn tự tài trợ, tăng cường tính linh hoạt và tốc độ ra quyết định.

Deepseek Hình ảnh: Ensigame.com

Hơn nữa, một số nhà nghiên cứu tại Deepseek kiếm được hơn 1,3 triệu đô la hàng năm, thu hút tài năng hàng đầu từ các trường đại học hàng đầu Trung Quốc (công ty không thuê các chuyên gia nước ngoài).

Với những sự thật này, yêu cầu đào tạo mô hình mới nhất của Deepseek chỉ với 6 triệu đô la xuất hiện không thực tế. Con số này chỉ bao gồm chi phí sử dụng GPU trong quá trình đào tạo trước và không bao gồm chi phí nghiên cứu, sàng lọc mô hình, xử lý dữ liệu hoặc chi phí cơ sở hạ tầng tổng thể.

Kể từ khi thành lập, Deepseek đã đầu tư hơn 500 triệu đô la vào phát triển AI. Tuy nhiên, cấu trúc nạc của nó cho phép nó thực hiện các đổi mới AI tích cực và hiệu quả hơn so với các công ty lớn hơn, quan liêu hơn.

Deepseek Hình ảnh: Ensigame.com

Ví dụ về Deepseek minh họa rằng một công ty AI độc lập, được tài trợ tốt thực sự có thể cạnh tranh với những người khổng lồ trong ngành. Tuy nhiên, các chuyên gia lưu ý rằng thành công của công ty được thúc đẩy bởi hàng tỷ đầu tư, đột phá kỹ thuật và một nhóm mạnh, trong khi tuyên bố về "ngân sách cách mạng" cho sự phát triển mô hình AI có phần phóng đại.

Tuy nhiên, chi phí của Deepseek vẫn thấp hơn so với các đối thủ cạnh tranh. Chẳng hạn, Deepseek đã chi 5 triệu đô la cho R1, trong khi Chatgpt4o có giá 100 triệu đô la để đào tạo.

Bài viết mới nhất Hơn+
  • 25 2025-05
    Retro Fighting Game Killer Bản năng Gold Bổ sung mới nhất cho Thư viện trực tuyến Nintendo Switch

    Killer Bản năng Gold gần đây đã được thêm vào Thư viện trực tuyến Nintendo Switch, đánh dấu một bổ sung thú vị khác cho những người đăng ký của gói mở rộng trực tuyến Nintendo Switch. Tiêu đề cổ điển này là một Cảng Nintendo 64 của Arcade Hit Killer Bản năng 2, bổ sung cho bản năng sát thủ gốc

  • 25 2025-05
    Floatopia đến trên Android với Vibes Crossing Animal

    Tại Gamescom năm nay, Netease Games đã tiết lộ danh hiệu mới nhất của họ, Floatopia, dự kiến ​​sẽ ra mắt trên nhiều nền tảng, bao gồm Android, vào năm tới. Trò chơi mô phỏng cuộc sống quyến rũ này mời người chơi đắm mình vào một thế giới của các hòn đảo và nhân vật lập dị. Đường mòn

  • 25 2025-05
    "Thỏa thuận Ngày Valentine: Tiết kiệm 100 đô la cho Apple iPad Air" mới "

    Chỉ trong thời gian cho Ngày Valentine, Amazon đang giảm 100 đô la cho máy tính bảng Apple iPad Air M2 2024 mới. Bạn có thể lấy mẫu 11 "chỉ với $ 499 (ban đầu $ 599) và mẫu 13" với giá $ 799 (giảm từ $ 899). Đây là giao dịch IPad Air tốt nhất năm 2025, phù hợp với giá Thứ Sáu Đen năm ngoái. Ipad Air