NVIDIA සහ Groq අත්වැල් බැඳගනියි: AI ක්ෂේත්රයේ වේගය උඩුයටිකුරු කරන අලුත් ගනුදෙනුව
AI ට්රේනින් වල රජු NVIDIA, දැන් Groq සමග එක්ව AI වේගය (Inference) අලුත් මට්ටමකට ගෙන යයි. UK Tech ක්ෂේත්රයට සහ ලෝකයටම මෙයින් සිදුවන බලපෑම මෙන්න.
NVIDIA සමාගම ලෝක ව්යාප්ත AI Hardware ක්ෂේත්රය දියුණු කිරීමට Groq හි Inference තාක්ෂණය ලබාගනියි
සෙමිකොන්ඩක්ටර් (Semiconductor) කර්මාන්තයේ දැවැන්ත පෙරළියක් සනිටුහන් කරමින්, NVIDIA සමාගම Groq හි Language Processing Unit (LPU) තාක්ෂණය සඳහා නිල වශයෙන් බලපත්ර ලබාගෙන තිබෙනවා. මේ හරහා මෙතෙක් පැවති "AI ට්රේනින් (Training) වලට පමණක් මුල්තැන දුන් කාලය" නිමා කරමින්, රියල්-ටයිම් (Real-time) AI අත්දැකීමක් ලබාදීම සඳහා අවශ්ය අතිශය වේගවත් (Ultra-low-latency) තාක්ෂණය දෙසට ලොව වටිනාම චිප් නිෂ්පාදකයා යොමු වී සිටිනවා.
වේගයේ විප්ලවය: ඇයි මේ Groq?
වසර ගණනාවක් පුරා NVIDIA සැලකුණේ AI ට්රේනින් ක්ෂේත්රයේ අවිවාදිත රජු ලෙසයි. ඔවුන්ගේ H100 සහ Blackwell චිප්ස්, AI මාදිලිවලට "හිතන්න උගන්වන්න" (Training) භාවිතා කරන ලොව හොඳම තාක්ෂණයන් ලෙස පිළිගැනෙනවා. නමුත් දැන් AI තාක්ෂණය පර්යේෂණාගාරවලින් එළියට ඇවිත් සැබෑ ලෝකයේ භාවිතයට එනකොට, ඇතිවෙලා තියෙන ලොකුම බාධාව (Bottleneck) තමයි "Inference" කියන දේ. සරලවම කිව්වොත්, AI එකක් පරිශීලකයෙකුගේ ප්රශ්නයකට ප්රතිචාර දක්වන වේගයයි මේ.
Groq සමාගමේ LPU තාක්ෂණය නිර්මාණය කරලා තියෙන්නේම මේ ප්රශ්නයට විසඳුම් දෙන්නයි. සාමාන්ය GPU එකක් එකවර වැඩ ගොඩක් කරන්න උත්සාහ කරද්දී ඇතිවන ප්රමාදය Groq හි Deterministic Architecture එක හරහා මගහැරෙනවා. මේ නිසා LLM (Large Language Models) වල අකුරු හෙමින් ටයිප් වෙනවා වගේ පෙනෙන ගතිය නැති වෙලා, ඇසිපිය හෙලන සැණින් ප්රතිචාර ලබාගන්න පුළුවන් වෙනවා.
Team Green (NVIDIA) ගේ උපායමාර්ගික වෙනස
Groq ගේ මේ තාක්ෂණය ලබා ගැනීම හරහා NVIDIA කරන්නේ වේගවත් එන්ජිමක් මිලදී ගන්නවා වගේ වැඩක් විතරක් නෙවෙයි; ඔවුන් තමන්ගේ සම්පූර්ණ දර්ශනයම වෙනස් කරමිනුයි ඉන්නේ. මේ ගනුදෙනුව හරහා තමන්ගේ දැවැන්ත CUDA පද්ධතියට, modern AI මාදිලිවලට අත්යවශ්ය Sequential Processing හැකියාව සහිත Hardware එකතු කරගන්න NVIDIA ට අවස්ථාව ලැබෙනවා.
UK වල Tech Professionals ලාට මේකෙන් ලැබෙන වාසිය
ඔයා ලන්ඩන් වල Fintech hub එකක හෝ මැන්චෙස්ටර් වල දියුණු වන "Silicon Canal" එකේ වැඩ කරන ඩිවලොපර් කෙනෙක් හෝ ආකිටෙක්ට් කෙනෙක් නම්, මේ ප්රවෘත්තිය ඔයාට ගොඩක් වැදගත් වේවි. එක්සත් රාජධානියේ High-frequency trading, සෞඛ්ය ක්ෂේත්රයේ රෝග විනිශ්චය (Healthcare diagnostics) සහ ස්වයංක්රීය පද්ධති (Autonomous systems) වල සාර්ථකත්වය රඳා පවතින්නේ තත්පරයකින් දහසෙන් පංගුවක (Milliseconds) වේගය මතයි.
Latency ගැටලුවට විසඳුමක්
මීට කලින් UK වල Startup වලට තෝරාගැනීමක් කරන්න සිද්ධ වුණා: එක්කෝ NVIDIA වල තියෙන පුළුල් සොෆ්ට්වෙයාර් සහය ලබාගන්න ඕනේ, නැත්නම් Groq වල තියෙන අධික වේගය ලබාගන්න ඕනේ. නමුත් මේ අලුත් ගනුදෙනුවත් එක්ක ඔයාලට මේ දෙකම එකට ලැබෙන අනාගතයක් පේන්න තියෙනවා. ඒ කියන්නේ NVIDIA වල විශ්වාසනීයත්වයත් එක්කම Real-time customer interfaces වලට ඕන කරන සුපිරි වේගයත් දැන් එකම තැනකින් ලැබෙනවා.
Sovereign AI Cloud එක Scaling කිරීම
එක්සත් රාජධානියේ රජය "Sovereign AI" හැකියාවන් වෙනුවෙන් දිගින් දිගටම ආයෝජනය කරන නිසා, දැන් අවශ්ය කරන හාඩ්වෙයාර් වල ස්වභාවයත් වෙනස් වෙමින් පවතිනවා. Inference ක්රියාවලිය සඳහා වැය වෙන්නේ ට්රේනින් වලට වඩා ඉතා අඩු විදුලි බලයක්. ඒ නිසා බ්රිතාන්යය පුරා වඩාත් තිරසාර සහ අධිවේගී ඩේටා සෙන්ටර්ස් (Data centers) ඉදි කිරීමට මේ ගනුදෙනුව හොඳ මගපෙන්වීමක් වේවි.
ට්රේනින් වල සිට ක්රියාත්මක කිරීම (Execution) දක්වා වෙනස
දැන් AI ලෝකයේ "Compute Wars" දෙවැනි අදියරට ඇවිත් තියෙන්නේ. පහුගිය අවුරුදු තුනේ අපි බැලුවේ කොහොමද දැවැන්ත AI මාදිලි හදන්නේ (Training) කියලා. හැබැයි ඊළඟ අවුරුදු පහේදී අපි අවධානය යොමු කරන්නේ ඒ මාදිලි එදිනෙදා ජීවිතයට ප්රයෝජනවත් වෙන විදිහට වේගයෙන් ක්රියාත්මක කරන්නේ (Execution) කොහොමද කියන එකටයි.
NVIDIA ගේ මේ පියවර හරහා Groq ගේ "Software-first" හාඩ්වෙයාර් සැලසුම් ක්රමය නිවැරදි බව තහවුරු වෙනවා. AI තාක්ෂණය ලෝකය පුරා ව්යාප්ත වෙන්න නම්, එය ක්රියාත්මක විය යුත්තේ Loading bar එකක වේගයෙන් නෙවෙයි, මිනිස් සිතුවිලි වල වේගයෙන්මයි.
ප්රතිඵල: ඉදිරි ගමන
මේ සහයෝගීතාවයත් එක්ක 2026 වෙද්දී AI වෙළඳපොළේ තරඟකාරීත්වය සම්පූර්ණයෙන්ම අලුත් මුහුණුවරක් ගනීවි. AMD සහ Intel වැනි සමාගම් NVIDIA ගේ ට්රේනින් ඒකාධිකාරයට අභියෝග කරන්න උත්සාහ කරද්දී, NVIDIA දැනටමත් Inference වෙළඳපොළේ තමන්ගේ බලය තහවුරු කරගෙන අවසන්.
ඉදිරි මාස 18 ඇතුළත "Hybrid Inference" කාඩ්පත් වෙළඳපොළට එනු ඇතැයි අපිට බලාපොරොත්තු වෙන්න පුළුවන්. Tech ක්ෂේත්රයේ ඉන්න අයට නම් මෙයින් ලැබෙන පණිවිඩය පැහැදිලියි: මින්පස්සේ වැදගත් වෙන්නේ "ඔයාගේ Model එකේ පරාමිතීන් (Parameters) කීයක් තියෙනවද?" කියන එක නෙවෙයි, "තත්පරයට සහ වැට් (Watt) එකකට ටෝකන් (Tokens) කීයක් ලබා දෙන්න පුළුවන්ද?" කියන එකයි. AI එකක් උත්තර දෙනකම් බලාගෙන ඉන්න කාලය දැන් ඉවරයි!