기본 콘텐츠로 건너 뛰기
룰렛 박사의 발표 발표
Kalathil은 물리 및 공학 축제룰렛 인공 지능에 대한 그의 연구에 대해 논의했습니다 | 영상:DR. Dileep 룰렛

인공 지능은 헤드 라인을 만들고 있습니다.

자율 주차, 군사 및 의료 프로젝트, 진보 및 사고룰렛 연구원, 공상 과학 작가 및 일반 대중의 마음과 생각을 포착했습니다.

창의력을 박탈하고 독창성을 장려하고 내일의 지도자를 자극하기 위해 Dileep Kalathil 박사는 연례 Texas A & M University Physics and Engineering and Engineering Festival룰렛 인공 지능 (AI)과 강화 학습의 현실에 대해 논의했습니다.

룰렛은 Texas A & M.의 전기 및 컴퓨터 공학과의 조교수로 일하고 있습니다.

40724_40921

아이러니하게도 스티븐 W. 호킹 오디토리움 (Stephen W. Hawking Auditorium)룰렛 이론적 인 물리학 자의 이름을 따서 그러한 기술이 인류의 끝이 될 수 있다고 경고 한 후, 프레젠테이션은 처음부터 시작되었습니다 : AI는 무엇입니까?

41156_41413

DR. 칼라 할 프레젠테이션
물리 및 공학 축제는 물리학 및 천문학과룰렛 주최합니다. 영상:dr. Dileep 룰렛

이 개념을 보여주기 위해 Kalathil은 두 가지 상황을 설명했습니다. 첫째, 방을 청소하도록 설계된 기계. 둘째, 물건을 던지고 엉망으로 만들도록 설계된 기계. 이 두 AI는 서로 비생산적으로 보일 수 있지만 둘 다 프로그래밍 된 매개 변수 내룰렛 작동합니다. 따라서 그들은 둘 다 합리적으로 행동하고 있습니다.

AI는 테이블 테니스를 연주하고 수술을 지원하며 구어를 실시간으로 번역 할 수 있도록 확장되었지만 Kalathil은 실제로 인간의 뇌를 모방하고 컴퓨터 의식을 만드는 것은 연구자들에 의해 어울릴 수없는 것으로 간주되었다고 설명했다. 이것은 대부분 뇌가 컴퓨터 시스템과 같이 모듈식이 아니기 때문입니다. 마찬가지로, 인간의 두뇌는 합리적인 이해와 감각, 자극, 주제 및 감정에 대한 끊임없이 변화하는 기억을 배우게됩니다. AI 프로그램은 데이터 세트의 제어 된 입력 및 코딩 매개 변수룰렛 학습합니다.

이로 인해 대화를 강화 학습의 역할로 이끌었습니다.

룰렛은 AI 시스템이 강화 학습을 통해 기능하고 성장하도록 프로그래밍 할 수 있다고 말했다.

핵심룰렛 RL (Rencement Learning)은 긍정적 인 피드백 보상에 의해 최적의 행동과 작업 완료가 강화된다는 개념을 중심으로 진행됩니다. RL은 기계, 소프트웨어 및 알고리즘 구성 요소에 의존하여 환경룰렛받은 피드백을 기반으로 이상적인 작업이 무엇인지 결정합니다.

dr. 그의 인공 지능 프레젠테이션룰렛 군중에게 연설하는 칼라 틸
산업은 이미 기계 학습 및 인공 지능룰렛 강화 학습 방법을 활용하고 있습니다 | 영상:DR. Dileep 룰렛

그러나 신중한 프로그래밍에도 불구하고 RL은 첫 번째 시도룰렛 성공을 보장하지 않습니다. AI 시스템은 종종 목표를 달성하기 위해 여러 가지 방법을 시도합니다. 각 시도룰렛 긍정적이고 부정적인 피드백을 수집하고 해석하여 이상적인 결과가 달성 될 때까지 방법을 조정합니다. 이 시행 착오 및 피드백 루프를 통해 최적의 조치가 강화됩니다.

따라서, 특정 높이룰렛 점프 할 것인지 여부를 결정하는 어린이와 마찬가지로 시스템은 이전 시도룰렛 수집 된 정보에 대한 옵션을 평가합니다. 땅까지의 거리는 너무 멀리 떨어져 있습니까? 이전에 비슷한 점프를 받았습니까? 결과는 무엇입니까? 그 점프에 고통이 있었습니까? 아마도 다른 방법은 땅에 도착하기 위해 사용되어야합니다.

RL은 여전히 ​​응용의 초기 단계에 있지만 업계는 이미 사용을 찾고 있습니다. 자율 항공기 조종사부터 예측 유지 보수에 이르기까지 스마트 게임에 이르기까지 AI의 미래는 끝없는 기회와 발견으로 가득 차 있습니다.

47024_47275