W nadchodzącej wersji sztucznej inteligencji (AI) Elona Muska większy nacisk zostanie położony na rozpoznawanie i interpretację obrazów rzeczywistych. Najnowsza wersja Groka w wersji 1.5 jest już gotowa do testów beta wśród wybranych testerów i obecnych klientów.
Wizja Grok-1.5 autorstwa Elona Muska: Skoncentruj się na zrozumieniu przestrzeni w świecie rzeczywistym
Chatbot AI Elona Muska, Grok, ma zaprezentować niecierpliwie oczekiwaną nową wersję, Grok-1.5. Ta aktualizacja będzie nastawiona na obsługę danych wizualnych, w tym dokumentów, diagramów, wykresów, zrzutów ekranu i zdjęć. Sam Elon Musk ogłosił te plany podczas wydarzenia „Grok-1.5 Vision Preview” na X, które odbyło się 13 kwietnia 2024 roku.
Grok-1.5 Vision
— Elon Musk (@elonmusk) 13 kwietnia 2024 r.
Zgodnie z zapowiedzią dokumentu nadchodząca aktualizacja chatbota będzie zawierać solidne narzędzie do przetwarzania obrazu o nazwie RealWorldQA, umożliwiające mu zrozumienie zdarzeń i sytuacji wizualnych.
Jesteśmy szczególnie podekscytowani możliwościami Groka w zrozumieniu naszego świata fizycznego
Jak wcześniej informował U.Today, Elon Musk wspomniał, że zaktualizowana wersja Groka, Grok 1.5, będzie miała możliwość czytania i podsumowywania postów X oraz pomagania użytkownikom X w ich tworzeniu.
Pierwsza wersja RealWorldQA zawiera około 700 obrazów, a każdemu z nich towarzyszy jasne pytanie i odpowiadająca mu odpowiedź oparta na faktach. Ta kolekcja jest swobodnie dostępna dla każdego zainteresowanego, na licencji Creative Commons BY-ND 4.0.
Grok-1.5V przewyższa GPT4 i Gemini Pro 1.5: Dane
Przełomowy zbiór danych składa się głównie ze zdjęć pozbawionych danych umożliwiających identyfikację pobranych z samochodów, a także różnych obrazów z życia wziętych.
W serii załączonych próbek Grok-1.5 przekształca schemat blokowy w kod Pythona, tworzy bajkę na dobranoc na podstawie obrazu dziecka, tworzy zbiór danych CSV ze zrzutu ekranu, „rozwija” mema i tak dalej.
Ponadto grupa xAI przedstawiła ocenę, jak Grok-1.5 wypada na tle swoich głównych konkurentów, GPT OpenAI, Gemini Pro 1.5 firmy Google i Claude 3 firmy Anthropic.
Według raportu xAI, Grok-1.5 wyróżniał się we wszystkich zadaniach matematycznych, rozumieniu tekstu i analizach sytuacji z życia codziennego w porównaniu do innych konkurentów.
- EUR PLN PROGNOZA
- USD PLN PROGNOZA
- NEAR PROGNOZA. NEAR kryptowaluta
- MOODENG PROGNOZA. MOODENG kryptowaluta
- BONK PROGNOZA. BONK kryptowaluta
- PEPE PROGNOZA. PEPE kryptowaluta
- RENDER PROGNOZA. RENDER kryptowaluta
- LINK PROGNOZA. LINK kryptowaluta
- Footy WAG Kellie Finlayson w rozdzierającym serce wywiadzie ujawnia prawdę o swojej śmiertelnej chorobie nowotworowej: „Żyję na pożyczonym czasie”
- EUR CHF PROGNOZA
2024-04-13 15:44