Elon Musk ujawnia, co będzie dalej z Grok AI

W nadchodzącej wersji sztucznej inteligencji (AI) Elona Muska większy nacisk zostanie położony na rozpoznawanie i interpretację obrazów rzeczywistych. Najnowsza wersja Groka w wersji 1.5 jest już gotowa do testów beta wśród wybranych testerów i obecnych klientów.

Wizja Grok-1.5 autorstwa Elona Muska: Skoncentruj się na zrozumieniu przestrzeni w świecie rzeczywistym

Chatbot AI Elona Muska, Grok, ma zaprezentować niecierpliwie oczekiwaną nową wersję, Grok-1.5. Ta aktualizacja będzie nastawiona na obsługę danych wizualnych, w tym dokumentów, diagramów, wykresów, zrzutów ekranu i zdjęć. Sam Elon Musk ogłosił te plany podczas wydarzenia „Grok-1.5 Vision Preview” na X, które odbyło się 13 kwietnia 2024 roku.

Grok-1.5 Vision

— Elon Musk (@elonmusk) 13 kwietnia 2024 r.

Zgodnie z zapowiedzią dokumentu nadchodząca aktualizacja chatbota będzie zawierać solidne narzędzie do przetwarzania obrazu o nazwie RealWorldQA, umożliwiające mu zrozumienie zdarzeń i sytuacji wizualnych.

Jesteśmy szczególnie podekscytowani możliwościami Groka w zrozumieniu naszego świata fizycznego

Jak wcześniej informował U.Today, Elon Musk wspomniał, że zaktualizowana wersja Groka, Grok 1.5, będzie miała możliwość czytania i podsumowywania postów X oraz pomagania użytkownikom X w ich tworzeniu.

Pierwsza wersja RealWorldQA zawiera około 700 obrazów, a każdemu z nich towarzyszy jasne pytanie i odpowiadająca mu odpowiedź oparta na faktach. Ta kolekcja jest swobodnie dostępna dla każdego zainteresowanego, na licencji Creative Commons BY-ND 4.0.

Grok-1.5V przewyższa GPT4 i Gemini Pro 1.5: Dane

Przełomowy zbiór danych składa się głównie ze zdjęć pozbawionych danych umożliwiających identyfikację pobranych z samochodów, a także różnych obrazów z życia wziętych.

W serii załączonych próbek Grok-1.5 przekształca schemat blokowy w kod Pythona, tworzy bajkę na dobranoc na podstawie obrazu dziecka, tworzy zbiór danych CSV ze zrzutu ekranu, „rozwija” mema i tak dalej.

Ponadto grupa xAI przedstawiła ocenę, jak Grok-1.5 wypada na tle swoich głównych konkurentów, GPT OpenAI, Gemini Pro 1.5 firmy Google i Claude 3 firmy Anthropic.

Według raportu xAI, Grok-1.5 wyróżniał się we wszystkich zadaniach matematycznych, rozumieniu tekstu i analizach sytuacji z życia codziennego w porównaniu do innych konkurentów.

2024-04-13 15:44