KFServing (KServe)
KFServing, Transformer, Predictor, Explainer
Last updated
Was this helpful?
KFServing, Transformer, Predictor, Explainer
Last updated
Was this helpful?
๋ณธ ๋ฌธ์๋ KServe 0.8 ๋ฒ์ ๊ธฐ์ค์ผ๋ก ์์ฑํ์๋ค.
KServe๋ Kubernetes์ ML Model์ Deployํ๊ณ Serving ๊ธฐ๋ฅ์ ์ ๊ณตํ๋ Model Inference Platform์ด๋ค.
InferenceService CR ์์ฑํ๊ณ Kubernetes API Server์ ๋ฑ๋กํ๋ฉด, Transformer, Predictor, Explainer ๋ฑ์ ์์ฑํ์ฌ Inference Service ๋ฅผ ๊ตฌ์ถํ ์ ์๋ค. Knative Serverless๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํธ๋ํฝ์ด ์์ ๋๋ scale-to-zero ๋์ํ๋ค.
Inferenceํ ๋ฐ์ดํฐ์ ์์น๋ฅผ ์ ์ํ๋ค. Predictor์ ML Framework spec์ ์ ์ํ ํ endpoint spec์ ์์ฑํ๋ค. ์์ฑํ endpoint spec์ InferenceService Metadata spec์ ์์ฑํด InferenceService๋ฅผ ์์ฑํ๋ค.
KF Serving ๊ตฌ์ฑ์์๋ Endpoint, Transformer, Predictor, Explainer ๊ฐ ์์ผ๋ฉฐ Endpoint ๋ง๋ค Explainer ๋ฅผ ๊ตฌ์ฑํ๊ณ ํ์์ ๋ฐ๋ผ Transformer, Explainer ๋ฅผ ์ถ๊ฐํ ์ ์๋ค.
InferenceService๋ Default Endpoint์ Canary 2๊ฐ๋ฅผ ์ ๊ณตํ๋ฉฐ, Rollout ์ ์ฑ ์ ์ ์ํ์ฌ ํธ๋ํฝ ๋น์จ์ ์กฐ์ ํ ์ ์๋ค.
์ฌ์ฉ์๊ฐ Predictor๋ Explainer ์ํ ์ ํ์ ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ, ํ์ฒ๋ฆฌ ํ ์ ์๋ค.
ML Model Server๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ฑฐ๋ ๋ถ๋ฅํ๋ ์ญํ ์ ํ๋ค.
XAI๋ก ๋ฐ์ดํฐ๋ฅผ ์์ธกํ๊ฑฐ๋ ๋ถ๋ฅํ ๊ฒฐ๊ณผ์ ๋ํด ํ๋จ ์ด์ ๋ฅผ ์ ์ํ๋ ์ญํ ์ ํ๋ค.
Readiness
GET
/v1/models/
Response:{"name": , "ready": true/false}
Predict
POST
/v1/models/:predict
Request:{"instances": []} Response:{"predictions": []}
Explain
POST
/v1/models/:explain
Request:{"instances": []} Response:{"predictions": [], "explainations": []}
https://kserve.github.io/website/ https://www.kubeflow.org/docs/components/kfserving/ https://devocean.sk.com/blog/techBoardDetail.do?ID=163739
KFServing ์์ ์ ๊ณตํ๋ Endpoint, Transformer, Explainer, Predictor ์ธ์ ๋ ๊ตฌ์ฑ์์๋ฅผ ์ถ๊ฐํ ์์ ์ด๋ฉฐ, Outlier Detection ๋ ๊ทธ ์ค ํ๋์ด๋ค.