2, %f18, %f1, %p1; // begin inline asm { cvt.f32.f16 %f3, %rs3;} // end inline asm setp.lt.ftz.f32 %p2, %f3, 0f00000000; mul.ftz.f32 %f19, %f3, %f17; selp.f32 %f4, %f19, %f3, %p2; // begin inline asm { cvt.rn.f16.f32 %rs4, %f4;} // end inline asm // begin inline asm { cvt.rn.f16.f32 %rs2, %f2;} // end inline asm mov.b32 %r5, {%rs2, %rs4}; mov.b32 {%rs5, %rs7}, %r3; // begin inline asm { cvt.f32.f16 %f5, %rs5;} // end inline asm setp.lt.ftz.f32 %p3, %f5, 0f00000000; mul.ftz.f32 %f20, %f5, %f17; selp.f32 %f6, %f20, %f5, %p3; // begin inline asm { cvt.f32.f16 %f7, %rs7;} // end inline asm setp.lt.ftz.f32 %p4, %f7, 0f00000000; mul.ftz.f32 %f21, %f7, %f17; selp.f32 %f8, %f21, %f7, %p4; // begin inline asm { cvt.rn.f16.f32 %rs8, %f8;} // end inline asm // begin inline asm { cvt.rn.f16.f32 %rs6, %f6;} // end inline asm mov.b32 %r6, {%rs6, %rs8}; mov.b32 {%rs9, %rs11}, %r2; // begin inline asm { cvt.f32.f16 %f9, %rs9;} // end inline asm setp.lt.ftz.f32 %p5, %f9, 0f00000000; mul.ftz.f32 %f22, %f9, %f17; selp.f32 %f10, %f22, %f9, %p5; // begin inline asm { cvt.f32.f16 %f11, %rs11;} // end inline asm setp.lt.ftz.f32 %p6, %f11, 0f00000000; mul.ftz.f32 %f23, %f11, %f17; selp.f32 %f12, %f23, %f11, %p6; // begin inline asm { cvt.rn.f16.f32 %rs12, %f12;} // end inline asm // begin inline asm { cvt.rn.f16.f32 %rs10, %f10;} // end inline asm mov.b32 %r7, {%rs10, %rs12}; mov.b32 {%rs13, %rs15}, %r1; // begin inline asm { cvt.f32.f16 %f13, %rs13;} // end inline asm setp.lt.ftz.f32 %p7, %f13, 0f00000000; mul.ftz.f32 %f24, %f13, %f17; selp.f32 %f14, %f24, %f13, %p7; // begin inline asm { cvt.f32.f16 %f15, %rs15;} // end inline asm setp.lt.ftz.f32 %p8, %f15, 0f00000000; mul.ftz.f32 %f25, %f15, %f17; selp.f32 %f16, %f25, %f15, %p8; // begin inline asm { cvt.rn.f16.f32 %rs16, %f16;} // end inline asm // begin inline asm { cvt.rn.f16.f32 %rs14, %f14;} // end inline asm mov.b32 %r8, {%rs14, %rs16}; mov.b32 %f26, %r8; mov.b32 %f27, %r7; mov.b32 %f28, %r6; mov.b32 %f29, %r5; st.param.f32 [func_retval0+0], %f29; st.param.f32 [func_retval0+4], %f28; st.param.f32 [func_retval0+8], %f27; st.param.f32 [func_retval0+12], %f26; ret; }