Amazon SageMaker에서 factorization machine을 사용하여 동영상 추천 프로그램 구축하기

추천 시스템(Recommender system)은 기계 학습(ML)에서 가장 많이 사용되는 응용프로그램 중 하나입니다. 이 글에서는 Amazon SageMaker에 내장된 알고리즘 중 하나인 factorization machine에 기반한 동영상 추천 모델과 인기 있는 MovieLens 데이터셋을 구축하는 방법을 보여 드리겠습니다.   Factorization Machine이란? FM(Factorization Machine)은 2010년에 도입되어 지도식 기계 학습 기법입니다(연구 논문, PDF). FM은 매트릭스 요소화를 통해 문제의 치수를 줄이는 기능에서 이름을…

추천 시스템(Recommender system)은 기계 학습(ML)에서 가장 많이 사용되는 응용프로그램 중 하나입니다. 이 글에서는 Amazon SageMaker에 내장된 알고리즘 중 하나인 factorization machine에 기반한 동영상 추천 모델과 인기 있는 MovieLens 데이터셋을 구축하는 방법을 보여 드리겠습니다.   Factorization Machine이란? FM(Factorization Machine)은 2010년에 도입되어 지도식 기계 학습 기법입니다(연구 논문, PDF). FM은 매트릭스 요소화를 통해 문제의 치수를 줄이는 기능에서 이름을…

Amazon SageMaker 자동 모델 튜닝: 기계 학습에 기계 학습을 사용하기

오늘 저는 Amazon SageMaker 자동 모델 튜닝의 출시를 발표하게 되어 기쁩니다. 자동 모델 튜닝 기능은 더 정확한 모델을 위해 하이퍼파라미터를 탐색하는데 필요한 차별화되지 않는 귀찮은 작업을 제거합니다. 이 기능을 통해 개발자와 데이터 과학자는 기계 학습 모델을 훈련하고 튜닝하는 데 상당한 시간과 노력을 절약할 수 있습니다. 하이퍼파라미터 튜닝 작업은 완료된 훈련 작업의 결과에 따라 서로 다른…

오늘 저는 Amazon SageMaker 자동 모델 튜닝의 출시를 발표하게 되어 기쁩니다. 자동 모델 튜닝 기능은 더 정확한 모델을 위해 하이퍼파라미터를 탐색하는데 필요한 차별화되지 않는 귀찮은 작업을 제거합니다. 이 기능을 통해 개발자와 데이터 과학자는 기계 학습 모델을 훈련하고 튜닝하는 데 상당한 시간과 노력을 절약할 수 있습니다. 하이퍼파라미터 튜닝 작업은 완료된 훈련 작업의 결과에 따라 서로 다른…

AWS 내부 유스케이스: AWS 마케팅 내부적으로 Amazon SageMaker 도입 및 평가하기

저희는 AWS 마케팅 데이터 사이언스 팀입니다. 저희는 고급 분석 및 기계 학습 (ML) 기술을 사용하여 영업 리드의 ML 중심 점수, ML 기반 타겟팅 세그먼트 및 다운스트림 영향 측정을 위한 계량 경제 모델과 같은 AWS 고객 라이프사이클 전반에 걸친 비즈니스 문제에 대한 통찰력을 공유합니다. Amazon 내에서 각 팀은 독립적으로 운영되며 자체 기술 스택을 선택하는 방법과 고객이…

저희는 AWS 마케팅 데이터 사이언스 팀입니다. 저희는 고급 분석 및 기계 학습 (ML) 기술을 사용하여 영업 리드의 ML 중심 점수, ML 기반 타겟팅 세그먼트 및 다운스트림 영향 측정을 위한 계량 경제 모델과 같은 AWS 고객 라이프사이클 전반에 걸친 비즈니스 문제에 대한 통찰력을 공유합니다. Amazon 내에서 각 팀은 독립적으로 운영되며 자체 기술 스택을 선택하는 방법과 고객이…

Amazon SageMaker 콘솔이 이제 Training Job 복제를 지원합니다.

현재 Amazon SageMaker 콘솔에 교육 작업 복제 기능이 추가되어 기존 작업을 기반으로 하는 교육 작업을 훨씬 쉽게 만들 수 있습니다. Amazon SageMaker를 사용하면 다양한 훈련 셋과 동일한 구성을 사용하여 여러 훈련 작업을 실행하는 것이 일반적입니다. 또한 특정 하이퍼매개 변수 또는 기본 컴퓨팅 리소스를 조정하고 모델을 다시 훈련하는 것이 일반적입니다. 이러한 시나리오에서는 기존 작업을 기반으로 새로운…

현재 Amazon SageMaker 콘솔에 교육 작업 복제 기능이 추가되어 기존 작업을 기반으로 하는 교육 작업을 훨씬 쉽게 만들 수 있습니다. Amazon SageMaker를 사용하면 다양한 훈련 셋과 동일한 구성을 사용하여 여러 훈련 작업을 실행하는 것이 일반적입니다. 또한 특정 하이퍼매개 변수 또는 기본 컴퓨팅 리소스를 조정하고 모델을 다시 훈련하는 것이 일반적입니다. 이러한 시나리오에서는 기존 작업을 기반으로 새로운…

Amazon SageMaker와 함께 R 사용하기

이 게시물에서는 Amazon SageMaker와 R을 이용하여 기계 학습(ML)모델에서 예측을 훈련, 배포, 검색하는 방법을 설명합니다. 껍데기에 있는 고리의 수로전복의 나이를 측정한 예측모델입니다. Reticulate 패키지는 Amazon SageMaker Python SDK에 대한 R 인터페이스로 사용되어 Amazon SageMaker에 API 호출을 합니다. reticulate 패키지는 R과 Python 객체를 변환하며, Amazon SageMaker는 서버 없는 데이터 과학 환경을 제공하여 ML 모델을 규모에 맞게 훈련하고…

이 게시물에서는 Amazon SageMaker와 R을 이용하여 기계 학습(ML)모델에서 예측을 훈련, 배포, 검색하는 방법을 설명합니다. 껍데기에 있는 고리의 수로전복의 나이를 측정한 예측모델입니다. Reticulate 패키지는 Amazon SageMaker Python SDK에 대한 R 인터페이스로 사용되어 Amazon SageMaker에 API 호출을 합니다. reticulate 패키지는 R과 Python 객체를 변환하며, Amazon SageMaker는 서버 없는 데이터 과학 환경을 제공하여 ML 모델을 규모에 맞게 훈련하고…

Amazon SageMaker 알고리즘에 파이프 입력 모드 사용하기

오늘 우리는 Amazon SageMaker의 내장 알고리즘을 위한 파이프 입력 모드 지원을 소개할 것입니다. 파이프 입력 모드에서는 데이터 세트가 먼저 다운로드되는 대신 교육 인스턴스로 직접 스트리밍 됩니다. 이는 교육 작업이 더 빨리 시작되고 더 빨리 완료되며 디스크 공간이 더 적게 필요함을 의미합니다. Amazon SageMaker 알고리즘은 빠르고 확장성이 뛰어나도록 설계되었습니다. 이 블로그 게시물에서는 파이프 입력 모드, 파이프…

오늘 우리는 Amazon SageMaker의 내장 알고리즘을 위한 파이프 입력 모드 지원을 소개할 것입니다. 파이프 입력 모드에서는 데이터 세트가 먼저 다운로드되는 대신 교육 인스턴스로 직접 스트리밍 됩니다. 이는 교육 작업이 더 빨리 시작되고 더 빨리 완료되며 디스크 공간이 더 적게 필요함을 의미합니다. Amazon SageMaker 알고리즘은 빠르고 확장성이 뛰어나도록 설계되었습니다. 이 블로그 게시물에서는 파이프 입력 모드, 파이프…

Amazon SageMaker을 사용하여 더 신속하게 대용량 주성분 분석을 수행하세요.

이번 블로그 게시물에서는 고차원 데이터세트에 Amazon SageMaker, Spark ML 및 Scikit-Learn를 사용하여 PCA에 대한 성능 비교를 할 것입니다. SageMaker는 지속적으로 더 빠른 계산 성능을 보여 주었습니다. 속도 개선을 확인하려면 하단의 그림 (1) 및 (2)를 참조하세요.   주성분 분석 주성분 분석 (Principal Component Analysis, PCA)은 가능한 한 많은 정보를 유지하면서 데이터세트 내의 차원성 (예 :기능의 갯수)를…

이번 블로그 게시물에서는 고차원 데이터세트에 Amazon SageMaker, Spark ML 및 Scikit-Learn를 사용하여 PCA에 대한 성능 비교를 할 것입니다. SageMaker는 지속적으로 더 빠른 계산 성능을 보여 주었습니다. 속도 개선을 확인하려면 하단의 그림 (1) 및 (2)를 참조하세요.   주성분 분석 주성분 분석 (Principal Component Analysis, PCA)은 가능한 한 많은 정보를 유지하면서 데이터세트 내의 차원성 (예 :기능의 갯수)를…

Amazon SageMaker에서 기계 학습을 통한 Amazon Pinpoint 캠페인

성공적인 비즈니스의 핵심은 고객에 대한 깊은 이해입니다. 이전 블로그 게시물에서 Amazon Redshift Spectrum을 AWS 데이터 레이크 전략의 일부로 사용하여 고객의 360o 이니셔티브를 향상시킬 수 있는 방법에 대해 설명했습니다. 이 블로그 게시물에서는 민첩성, 비용 효율성 및 AWS를 통해 고객 분석 실행을 통해 혁신을 도울 수 있는 방법을 지속적으로 보여 드리고자 합니다. 많은 사람들이 AI가 고객의 360o 이니셔티브를…

성공적인 비즈니스의 핵심은 고객에 대한 깊은 이해입니다. 이전 블로그 게시물에서 Amazon Redshift Spectrum을 AWS 데이터 레이크 전략의 일부로 사용하여 고객의 360o 이니셔티브를 향상시킬 수 있는 방법에 대해 설명했습니다. 이 블로그 게시물에서는 민첩성, 비용 효율성 및 AWS를 통해 고객 분석 실행을 통해 혁신을 도울 수 있는 방법을 지속적으로 보여 드리고자 합니다. 많은 사람들이 AI가 고객의 360o 이니셔티브를…

Amazon SageMaker 로컬 모드를 사용하여 노트북 인스턴스 기량 연마하기

Amazon SageMaker는 사전 구축된 TensorFlow 와 MXNet 컨테이너를 사용하여 로컬 교육에 대한 지원을 시작했습니다. Amazon SageMaker는 생산 현장에서 머신러닝 모델을보다 효과적으로 구축, 교육 및 배포 할 수있는 유연한 기계 학습 플랫폼입니다. Amazon SageMaker 교육 환경은 관리가 가능합니다. 즉, 인스턴스를 회전시키고 알고리즘 컨테이너를 로드하며 Amazon S3에서 데이터를 가져 와서 코드를 실행하고 Amazon S3에 결과를 출력하고 클러스터에…

Amazon SageMaker는 사전 구축된 TensorFlow 와 MXNet 컨테이너를 사용하여 로컬 교육에 대한 지원을 시작했습니다. Amazon SageMaker는 생산 현장에서 머신러닝 모델을보다 효과적으로 구축, 교육 및 배포 할 수있는 유연한 기계 학습 플랫폼입니다. Amazon SageMaker 교육 환경은 관리가 가능합니다. 즉, 인스턴스를 회전시키고 알고리즘 컨테이너를 로드하며 Amazon S3에서 데이터를 가져 와서 코드를 실행하고 Amazon S3에 결과를 출력하고 클러스터에…

이제 Amazon SageMaker에 대해 AutoScaling을 사용할 수 있습니다.

AWS ML 플랫폼 팀의 제품 매니저인 Kumar Venkateswar가 Amazon SageMaker와 함께 AutoScaling에 대한 발표 내용을 공유합니다. Amazon SageMaker를 사용하여 수천명의 고객이 자신들의 머신 러닝(ML)모델을 쉽게 구축, 교육 및 배포할 수 있습니다. 현재 Amazon SageMaker용 AutoScaling 기능을 사용하면 프로덕션 ML 모델을 더욱 쉽게 관리할 수 있습니다. 유추에 따라 필요한 크기에 맞게 인스턴스 수를 수동으로 관리하는 대신…

AWS ML 플랫폼 팀의 제품 매니저인 Kumar Venkateswar가 Amazon SageMaker와 함께 AutoScaling에 대한 발표 내용을 공유합니다. Amazon SageMaker를 사용하여 수천명의 고객이 자신들의 머신 러닝(ML)모델을 쉽게 구축, 교육 및 배포할 수 있습니다. 현재 Amazon SageMaker용 AutoScaling 기능을 사용하면 프로덕션 ML 모델을 더욱 쉽게 관리할 수 있습니다. 유추에 따라 필요한 크기에 맞게 인스턴스 수를 수동으로 관리하는 대신…