Chi tiết về NVIDIA Tegra X1: CPU 8 nhân, GPU Maxwell 256 nhân, mức độ sử dụng điện tốt...

Trong vài năm qua chúng ta đã chứng kiến sự chuyển dịch về mặt chiến lược của NVIDIA đối với các con chip di động. Ở Tegra 2 và Tegra 3, hãng đã đưa sản phẩm của mình vào nhiều smartphone và tablet được bán rộng rãi trên thị trường. Những SoC (System-on-Chip) này sở hữu GPU được thiết kế riêng và NVIDIA nhấn mạnh vào khả năng xử lý đồ họa của chúng. Đến Tegra 4, số lượng thiết bị di động được ra mắt có tích hợp SoC của NVIDIA giảm xuống, tới Tegra K1 thì chỉ một vài máy sử dụng và mới đầu năm nay khi ra mắt Tegra X1, hãng đã chuyển hẳn trọng tâm của mình sang thị trường xe ô-tô. Vậy con chip Tegra X1 này có gì lạ và hay?

Sự thay đổi về cách tiếp cận

Tegra X1 có tên mã là Erista. Thực chất hồi năm ngoái NVIDIA chia sẻ Erista sẽ sử dụng nhân tùy biến Denver (tương tự bản Tegra K1 64-bit), kiến trúc GPU Maxwell và được sản xuất trên dây chuyền 16nm FinFet. Đây là một kế hoạch đầy tham vọng. Thế nhưng hãng đã không kịp thực hiện kế hoạch này, thay vào đó họ quyết định sử dụng nhân có sẵn ARM Cortex-A53 và A57 (vẫn hỗ trợ điện toán 64-bit) cho Erista, dây chuyền sản xuất thì chọn loại 20nm hiện hữu nhằm nhanh chóng đưa chip đến tay các công ty sản xuất phần cứng, chỉ có mỗi nhân đồ họa Maxwell là còn giữ nguyên theo kế hoạch.

Vì sao lại có sự thay đổi trên? Theo trang tin AnandTech, NVIDIA làm như vậy là để theo đuổi một cách tiếp cận mới đối với quá trình thiết kế SoC. Cách tiếp cận này sẽ nhấn mạnh vào việc rút ngắn thời gian đẩy sản phẩm ra thị trường so với các thế hệ Tegra trước (quick time-to-market). NVIDIA vẫn chưa chính thức hủy bỏ kế hoạch 16nm, tuy nhiên đến nay công ty vẫn kín tiếng về tiến độ của quy trình sản xuất này. Có lẽ phải đến năm sau, khi mà thế hệ mới của Tegra được trình làng thì chúng ta mới biết thêm về các SoC 16nm, còn hiện tại thì Tegra X1 sẽ xài công nghệ 20nm.

CPU của Tegra X1

Quay trở lại với nhân vật chính, Tegra X1, đầu tiên chúng ta hãy xem xét phần CPU của con chip này. Nó bao gồm 4 nhân Cortex-A57 và 4 nhân Cortex-A53, trong đó A57 mạnh mẽ hơn còn A53 tuy yếu hơn nhưng lại có khả năng tiết kiệm điện tốt. Cụm A57 sở hữu bộ nhớ cache L2 với dung lượng 2MB được chia sẻ cho tất cả các nhân, trong khi cụm A53 thì có 512KB và cũng được chia sẻ cho mọi nhân.

Nhưng điều đặc biệt nằm ở chỗ thay vì bám sát cấu hình tiêu chuẩn ARM big.LITTLE để cho phép một hoặc nhiều nhân chạy cùng lúc tùy theo nhu cầu thiết bị, NVIDIA đưa vào thêm một vài điều chỉnh của riêng mình. Việc giao tiếp giữa các nhân với nhau (interconnect) đã được hãng tùy biến lại chứ không xài bộ giao thức CCI-400 do ARM thiết kế. Toàn bộ 8 nhân của Tegra X1 cũng đều có thể được sử dụng bởi các ứng dụng thông thường mà không gặp phải sự hạn chế nào.

CPU_NVIDIA_Tegra_X1.

Một điều đáng nói nữa đó là Tegra X1 sử dụng hệ thống phân phối tác vụ cho CPU xử lý theo dạng di chuyển cụm (cluster migration), không phải dạng phân phối toàn cục (global task scheduling). Dạng phân phối cluster này thường phải hi sinh hiệu năng để có được mức độ tiêu thụ điện thấp, còn muốn có hiệu năng cao thì buộc phải xài điện nhiều lên. Để khắc phục nhược điểm trên, NVIDIA đưa ra giải pháp xài bộ nhớ cache chung giữa các nhân với nhau, và hãng đã tối ưu việc truy xuất dữ liệu chung nhằm đạt được hiệu suất hoạt động tốt hơn.

Theo lời NVIDIA, Tegra X1 có hiệu năng cao hơn 1,4 lần so với con chip Samsung Exynos 5433 ở cùng mức tiêu hao điện năng. Exynos 5433 hiện đang được dùng cho Galaxy Note 4, nó cũng là con chip 8 nhân, cũng dùng ARM Cortex-A57 kết hợp với A53. Chính vì thế, sự khác biệt hiệu năng nhiều khả năng đến từ cách mà NVIDIA triển khai cấu hình tùy biến cho CPU, cũng như sự khác nhau giữa quy trình 20nm của TSMC (công ty Đài Loan làm nhiệm vụ gia công X1) với quy trình 20nm của Samsung.

Tóm lại, phần CPU của Tegra X1 đặc biệt bởi vì nó sử dụng rất nhiều thành phần tùy biến của riêng NVIDIA, chỉ có mỗi nhân là sử dụng thiết kế tham chiếu của ARM mà thôi. Đây là chuyện không nhiều nhà sản xuất thực hiện bởi hầu hết họ đều xài những công nghệ do ARM phát triển sẵn để tiết kiệm thời gian và chi phí nghiên cứu. Trong khi đó, NVIDIA đã dám đầu tư mạnh vào mảng này nhằm thu được hiệu năng và mức độ tiết kiệm điện tốt hơn.

Các chi tiết khác ngoài CPU và GPU

Ngoài CPU và GPU, NVIDIA còn cải thiện nhiều khía cạnh khác của Tegra X1 so với thế hệ K1 trước đây. Ví dụ, bộ nhớ RAM LPDDR3 băng thông 64-bit của K1 đã được thay thế bằng LPDDR4 64-bit, nhờ đó mà băng thông bộ nhớ có thể truyền tải được tối đa tăng từ 14,9GB/s lên thành 25,6GB/s. Song song đó, mức độ tiết kiệm điện cũng tốt hơn 40%. Bộ điều khiển bộ nhớ (storage controller) của X1 đã hỗ trợ chuẩn eMMC 5.1 để đạt tốc độ truyền tải nhanh hơn với bộ nhớ trong.

Nhờ những cải tiến chung mà giờ đây Tegra X1 hỗ trợ màn hình tích hợp với độ phân giải tối đa 3840x2160 @ 60Hz, trong khi K1 chỉ dừng ở 3200x2000 @ 60Hz mà thôi. Còn khi kết nối với màn hình rời bên ngoài, X1 hỗ trợ giao thức HDMI 2.0 và HDCP 2.2, tức là bạn sẽ xem được hình ảnh 4K @ 60Hz thay vì chỉ 4K @ 30Hz như thế hệ Tegra trước.

Bộ xử lý tín hiệu hình ảnh (ISP) của X1 gần như tương đồng với K1 khi nói về tính năng, tuy nhiên tốc độ nén và giải nén ảnh JPEG giờ đây nhanh hơn 5 lần theo lời quảng cáo của NVIDIA, từ 120 megapixel mỗi giây lên thành 600 megapixel mỗi giây. Đối với video, X1 hỗ trợ codec H.265 và VP9, một điều cần thiết cho tương lai của việc truyền video 4K trực tuyến từ Internet về thiết bị cuối của khách hàng.

GPU của Tegra X1: Maxwell lên di động

Điểm nhấn thật sự của chip Tegra X1 nằm ở bộ xử lý đồ họa vì nó sử dụng cùng vi kiến trúc Maxwell như trên các GPU mạnh mẽ dành cho máy tính PC. Maxwell lần đầu xuất hiện vào năm ngoái và người ta gọi đây là thế hệ đầu tiên, sau đó đến khoảng tháng 9 thì Maxwell thế hệ 2 ra đời. Nhưng có một điều ít ai biết, đó là Maxwell đã được thiết kế hướng đến thiết bị di động ngay từ những ngày đầu còn trong phòng thí nghiệm của hãng, trong khi kiến trúc GPU Kepler trước đây trên Tegra K1 chỉ là một bản được chuyển thể từ PC sang mà thôi. Đây là chiến lược "đặt thiết bị di động lên hàng đầu" được NVIDIA theo đuổi, và việc ra mắt Tegra X1 đã đánh dấu một cột mốc quan trọng trong quá trình đó.

Mobile-First.

Bằng cách này, NVIDIA đã thu được một số thành công đáng kể. Đầu tiên là việc kiến trúc GPU mới nhất của hãng đã có mặt trên di động sớm hơn bao giờ hết (khoảng cách giữa Maxwell 1 và Tegra X1 là 1 năm, còn Kepler và Tegra K1 thì đến tận 2 năm). Nó cũng có nghĩa là NVIDIA đang tối ưu hóa rất sâu kiến trúc đồ họa của mình để dùng trên di động, đặc biệt là về mặt hiệu quả tiêu thụ điện. Cũng chính vì thế mà những card đồ họa Maxwell trên PC hiện đang dẫn đầu bảng về tỉ số hiệu năng chia điện năng, tất nhiên Tegra X1 cũng được hưởng lợi tương tự.

Đứng ở khía cạnh tính năng, NVIDIA đã đưa ra một con chip Tegra X1 với những thông số cực kì ấn tượng nhờ sự xuất hiện của Maxwell với tất cả 256 nhân đồ họa. Trong khi đó, ở khía cạnh năng lượng, NVIDIA muốn cho mọi người thấy rằng họ có thể làm ra được SoC dùng nhân A57 tốt nhất thị trường. Trong bối cảnh những công ty khác cũng xài chung nhân A57 thì GPU sẽ là điểm giúp sản phẩm của NVIDIA trở nên khác biệt và tạo ra một lợi thế cạnh tranh cực kì tốt.

Đi sâu hơn về GPU của X1, nó là một bản Maxwell 2 được tối ưu cho chip Tegra. So với thế hệ Kepler trước, Maxwell 2 có một vài điểm mới sau: kĩ thuật nén màu delta thế hệ thứ 3, đơn giản hóa việc xử lý đa nhân trên mỗi nhân CUDA trong khi hiệu quả năng lượng tốt hơn, hệ thống khử răng cưa ngon lành hơn, hỗ trợ tốt hơn cho thực tế ảo... Nếu muốn xem thêm, bạn có thể đọc ở bài viết: Những thông tin thú vị về vi kiến trúc NVIDIA Maxwell.

Riêng với X1, việc mở rộng băng thông RAM cũng như hiệu quả tiêu thụ điện chung tăng lên chính là 2 trong số những điểm cải tiến đáng giá nhất. Lý do? Chúng giải quyết được 2 "nút thắt cổ chai" thường thấy trong các GPU dùng cho SoC di động.

Nút thứ nhất nằm ở chỗ băng thông bộ nhớ không kịp đáp ứng cho việc xử lý và xuất hình ảnh độ phân giải cao. Người ta có giải pháp là tăng độ rộng bus RAM từ 64-bit lên thành 96-bit hoặc 128-bit. Cách này rất hiệu quả, nhưng bù lại chi phí và mức độ phức tạp sẽ tăng lên cho chính bản thân con chip SoC lẫn các phần cứng khác. Trong trường hợp của Tegra X1, NVIDIA tiếp tục xài băng thông 64-bit, tuy nhiên hãng đã áp dụng kĩ thuật nén tốt hơn kết hợp với việc mở rộng dung lượng băng thông của LPDDR4. Nhờ vậy mà GPU có thể phát huy sức mạnh của mình mà không phải lo lắng nhiều về chuyện "đói" bộ nhớ.

Nút thứ hai nằm ở mối quan hệ giữa hiệu năng và năng lượng, và chỉ số TDP thường dùng để nói về vấn đề này. Theo trang AnandTech, TDP của Tegra X1 có thể xuống rất thấp, chỉ 10W. Khi kết hợp với quy trình sản xuất 20nm của TSMC, việc tiêu thụ điện tốt của SoC sẽ làm cho hiệu năng chung của GPU tăng lên.

EnergyEff.

Ở cùng mức năng lượng, GPU của Tegra X1 đạt hiệu năng cao hơn so với K1

Cuối cùng nhưng cũng không kém phần quan trọng, đó là Tegra X1 sở hữu một tính năng mà các card đồ họa Maxwell trên desktop không hề có. Với tên gọi Double Speed FP16, NVIDIA nhúng hệ thống này vào trong các nhân CUDA. Đây là một phương thức dựng hình ảnh sử dụng các mục tiêu (render target), mỗi mục tiêu được mã hóa bằng một con số dấu chấm động 16-bit. Nói tóm tắt thì Double Speed FP16 sẽ giúp việc nhận dạng hình ảnh của GPU trên Tegra X1 được chính xác và hơn chóng hơn, vốn là một yếu tố quan trọng khi được trang bị trên xe hơi (mình sẽ nói kĩ hơn về điều này trong phần bên dưới).

Một vài con số của GPU trên Tegra X1

Trong bảng trên thì có một vài con số đáng chú ý. Trước hết là số đơn vị dựng hình ảnh đầu ra (render output unit - ROP) của X1 đã tăng gấp 4 lần so với K1, và con số 16 ROP được xem là khá nhiều. Nó cũng bằng với ROP trên một số card đồ họa Maxwell dùng cho máy tính. Đây là điều cần thiết vì NVIDIA muốn xuất hình ảnh từ Tegra X1 ra màn hình 4K @ 60Hz, thế nên họ phải dùng đến rất nhiều ROP mới có thể đảm đương hết số lượng pixel khổng lồ của hình ảnh. Việc cải thiện hiệu năng và băng thông bộ nhớ cũng khiến NVIDIA dễ dàng "mớm" dữ liệu cho các ROP hơn.

Nói về sức mạnh 1 TFLOPs mà NVIDIA quảng cáo, đây là mức hiệu năng có thể được xếp ngang với các máy tính thực thụ, thậm chí là "siêu máy tính" theo lời hãng sản xuất. Trang AnandTech cho biết thêm rằng đây chính là hiệu năng tính toán dấu chấm động theo kiểu FP16 (chữ FP là floating point), và nó đạt được là nhờ xung nhịp 1GHz của GPU (không phải xung CPU nhé). Xung nhịp kiểu này cũng rất cao so với các bộ xử lý đồ họa di động khác trên thị trường.

So sánh hiệu năng giữa Tegra X1, K1 và Apple A8X

Bên dưới là số liệu thu thập từ phần trình diễn của NVIDIA, trong đó hai con chip X1 và K1 nằm trên những bảng mạch tham chiếu, còn Apple A8X thì nằm trong iPad Air 2. NVIDIA đã cho chạy thử ba phép benchmark và kết quả là X1 đều vượt trội hơn so với hai ứng viên còn lại. Bạn có thể xem chi tiết điểm số bằng hai biểu đồ bên dưới. Tất nhiên, đây chỉ là hoạt động trong môi trường lý tưởng, còn để có được điểm chi tiết hơn thì chúng ta sẽ phải đợi đến khi X1 bắt đầu có mặt trên thị trường.

Ngoài ra, công cụ đo của NVIDIA còn cho thấy rằng mức tiêu thụ điện trung bình của GPU trong Tegra X1 khi chạy phép thử Manhattan của GFXBench là 1,51W. Trong khi đó, chỉ số này ở GPU của Apple A8X là 2,67W nhưng hiệu năng lại thấp hơn. Đáng lưu ý là cả Apple A8X và Tegra X1 đều được sản xuất bằng dây chuyền 20nm của TSMC, như vậy sự chênh lệch đến từ cách mà mỗi hãng triển khai thiết kế GPU chứ không phải là do công nghệ bán dẫn.

Ứng dụng thực tế của Tegra X1: xe ô-tô

Nãy giờ nói dong dài nào là GPU di động, rồi SoC di động thì có lẽ nhiều bạn sẽ nghĩ rằng Tegra X1 chắc hẳn đang chuẩn bị xuất hiện trên nhiều smartphone hay tablet mới trong năm nay. Nhưng không, mục tiêu ban đầu của NVIDIA đối với X1 không phải là thiết bị di động! Thay vào đó, hãng muốn dành con chip này cho thị trường ô-tô, mà cụ thể hơn là việc phát triển xe hơi thông minh cũng như các hệ thống bổ sung có khả năng giúp việc lái xe trở nên an toàn, vui vẻ và tiện lợi hơn.

Để chuẩn bị cho điều đó, hãng đã ra mắt hai chiếc "máy tính" mới. Gọi là máy tính nhưng thực chất chúng không phải là thùng máy to kềnh như những chiếc desktop hay laptop, thay vào đó chỉ là một bo mạch với các cổng kết nối và linh kiện cần thiết. Chiếc máy tính đầu tiên, DRIVE PX, được NVIDIA định hướng sử dụng cho việc phát triển khả năng tự lái của ô-tô, trong khi chiếc thứ hai là DRIVE CX thì được sử dụng cho những "hệ thống buồng lái kĩ thuật số cao cấp".

Một vài hình ảnh về ứng dụng của Tegra X1 trong xe hơi

Cả hai đều sử dụng vi xử lý NVIDIA Tegra X1, và nhờ cấu hình 8 nhân CPU + 256 nhân GPU chạy song song mà X1 sẽ được dùng để xử lý tín hiệu từ nhiều camera và cảm biến gắn trên những chiếc xe hơi tương lai, từ đó giúp việc tự hành của xe trở nên trơn tru và chính xác hơn. Các máy tính cũng sẽ học hỏi thói quen, hành vi người dùng cũng như điều kiện ngoại cảnh nhằm đưa ra những quyết định thông minh.

Nói cụ thể hơn về DRIVE PX, mẫu máy tính này có đến 2 con chip Tegra X1, hỗ trợ tối đa 12 camera độ phân giải cao cùng lúc và có khả năng xử lý 1,3 gigapixel hình ảnh mỗi giây. Tính năng Auto-Valet trên máy sẽ cho phép xe hơi đỗ tự động mà không cần sự can thiệp từ người lái. Thậm chí nó còn có khả năng tự tìm chỗ trống, đỗ vào, rồi khi được gọi từ smartphone thì sẽ tự động chạy đến chỗ bạn đang đứng. DRIVE PX còn tận dụng các kĩ thuật deep learning để phân biệt các loại phương tiện khác nhau: đâu là xe cấp cứu, đâu là xe tải bình thường, đâu là xe cảnh sát, hoặc đâu là chiếc xe chuẩn bị rời khỏi lề đường để tham gia giao thông. Dựa vào thông tin đó, xe sẽ đưa ra những phản ứng phù hợp.

Về DRIVE CX, đây là một giải pháp phần cứng lẫn phần mềm để phục vụ cho việc chỉ đường, giải trí trong xe, điều khiển các thiết bị, công cụ trong xe và giám sát việc lái xe. Tính năng Surround-Vision của DRIVE CX (và cả PX nữa) sẽ cho phép xem không gian 360 độ xung quanh xe theo thời gian thực, hạn chế được các vấn đề liên quan đến điểm mù của tầm nhìn khi lái, đồng thời thế luôn cả kính chiếu hậu bằng một kính thông minh. DRIVE CX sử dụng 1 chip Tegra X1 hoặc Tegra K1 (đời cũ hơn, ra mắt năm ngoái). Nó có thể xử lý 16,8 triệu pixel ảnh và hiển thị thông tin lên nhiều màn hình cùng lúc.

Hiện tại NVIDIA đang hợp tác với Audi để phát triển những chiếc xe tự hành dùng DRIVE PX. Hãng cũng sẽ tiếp tục giao hai mẫu máy tính này đến cho các công ty sản xuất xe hơi hoặc các nhà cung cấp giải pháp bên thứ ba. Cả hai sẽ bắt đầu được giao hàng trong quý 2 năm nay.

Kết

Với Tegra X1, NVIDIA đã giới thiệu rất nhiều thay đổi so với K1. Chúng ta đã chứng kiến việc sử dụng các nhân Cortex-A53 và A57 mới, kiến trúc GPU mới, quy trình sản xuất mới, thậm chí cả cách tiếp cận mới với thiết kế SoC di động. NVIDIA cũng nhúng vào trong con chip này rất nhiều thành phần tùy biến của hãng để tối ưu hóa mức độ tiêu thụ điện và hiệu năng xử lý, từ đó đưa ra được giải pháp SoC vừa mạnh vừa tiết kiệm điện. Thị trường đầu tiên mà X1 nhắm tới, lạ thay, không phải là smartphone hay tablet mà lại là xe hơi. Tất nhiên nó hoàn toàn có thể được tích hợp lên thiết bị di động, nhưng đó không phải là trọng tâm của NVIDIA vào lúc này. Liệu Tegra X1 có thể thay đổi cách người ta lái xe, và cách mà xe hơi sẽ được đối xử như một chiếc "máy tính di động" hay không? Chúng ta hãy chờ xem.

Tham khảo: AnandTech, NVIDIA, Wikipedia, Geeks3D

Content you add hereTheo: tinhte.vn

13/1/15

Chi tiết về NVIDIA Tegra X1: CPU 8 nhân, GPU Maxwell 256 nhân, mức độ sử dụng điện tốt...

Socialize It →

Đăng ký theo dỏi những bài viết mới

0 nhận xét:

Đăng nhận xét

Tìm kiếm

Subscribe

Nổi bật

Labels

13/1/15

Chi tiết về NVIDIA Tegra X1: CPU 8 nhân, GPU Maxwell 256 nhân, mức độ sử dụng điện tốt...

Socialize It →

Đăng ký theo dỏi những bài viết mới

Other Interesting Posts :

0 nhận xét:

Đăng nhận xét

Tìm kiếm

Subscribe

Nổi bật

Labels