simple linear model in unit test.

5 years ago · 2062ad09de
--- a/src/TensorFlowNET.Core/APIs/c_api.cs
+++ b/src/TensorFlowNET.Core/APIs/c_api.cs
@@ -43,7 +43,7 @@ namespace Tensorflow
    /// </summary>
    public partial class c_api
    {
        public const string TensorFlowLibName = "tensorflow";
        public const string TensorFlowLibName = @"D:\SciSharp\tensorflow-google\bazel-bin\tensorflow\tensorflow.dll";

        public static string StringPiece(IntPtr handle)
        {
--- a/src/TensorFlowNET.Core/Eager/EagerOperation.cs
+++ b/src/TensorFlowNET.Core/Eager/EagerOperation.cs
@@ -8,6 +8,8 @@ namespace Tensorflow.Eager
    {
        public int NumInputs;
        public Tensor[] Inputs { get; set; }
        public int NumOutputs;
        public Tensor[] Outputs { get; set; }
        public int[] SkipInputIndices { get; set; }

        public EagerOperation() : base(IntPtr.Zero) { }
@@ -31,5 +33,18 @@ namespace Tensorflow.Eager
                return _inputs_val;
            }
        }

        public override Tensor[] outputs
        {
            get
            {
                if (_outputs == null)
                {
                    _outputs = Outputs;
                }

                return _outputs;
            }
        }
    }
 }
--- a/src/TensorFlowNET.Core/Eager/c_api.eager.cs
+++ b/src/TensorFlowNET.Core/Eager/c_api.eager.cs
@@ -11,14 +11,12 @@ namespace Tensorflow
        public static extern void TFE_RegisterGradientFunction(_gradient_function_callback callbackPointer);

        [UnmanagedFunctionPointer(CallingConvention.StdCall)]
        public delegate IntPtr _gradient_function_callback(string op_name, 
            int num_inputs, 
            IntPtr op_inputs, 
            int num_attrs, 
            int num_outputs, 
            IntPtr output_grads, 
            int num_skip_inputs,
            IntPtr skip_input_indices);
        public delegate IntPtr _gradient_function_callback(string op_name,
            BindingArray op_inputs,
            BindingArray op_outputs,
            int num_attrs,
            BindingArray output_grads, 
            BindingArray skip_input_indices);

        [DllImport(TensorFlowLibName)]
        public static extern IntPtr TFE_WrapGradientResult(IntPtr[] gradients, int num_gradients);
--- a/src/TensorFlowNET.Core/Gradients/math_grad.cs
+++ b/src/TensorFlowNET.Core/Gradients/math_grad.cs
@@ -310,11 +310,23 @@ namespace Tensorflow.Gradients
            var input_shape = op.inputs[0]._shape_tuple();
            var output_shape = op.outputs[0]._shape_tuple();

            var input_shape_tensor = array_ops.shape(op.inputs[0]);
            var output_shape_tensor = array_ops.shape(op.outputs[0]);
            var factor = _safe_shape_div(math_ops.reduce_prod(input_shape_tensor), math_ops.reduce_prod(output_shape_tensor));
            if(input_shape != null &&
                output_shape != null)
            {
                var input_size = np.prod(input_shape);
                var output_size = np.prod(output_shape);
                var factor = (int)input_size / Math.Max((int)output_size, 1);
                var factor_tensor = constant_op.constant((int)input_size, dtype: sum_grad.dtype);
                return new Tensor[] { math_ops.truediv(sum_grad, math_ops.cast(factor_tensor, sum_grad.dtype)), null };
            }
            else
            {
                var input_shape_tensor = array_ops.shape(op.inputs[0]);
                var output_shape_tensor = array_ops.shape(op.outputs[0]);
                var factor = _safe_shape_div(math_ops.reduce_prod(input_shape_tensor), math_ops.reduce_prod(output_shape_tensor));

            return new Tensor[] { math_ops.truediv(sum_grad, math_ops.cast(factor, sum_grad.dtype)), null };
                return new Tensor[] { math_ops.truediv(sum_grad, math_ops.cast(factor, sum_grad.dtype)), null };
            }
        }

        /// <summary>
--- a/src/TensorFlowNET.Core/Keras/Optimizers/OptimizerV2.cs
+++ b/src/TensorFlowNET.Core/Keras/Optimizers/OptimizerV2.cs
@@ -43,7 +43,7 @@ namespace Tensorflow.Keras.Optimizers

                _aggregate_gradients(grads_and_vars);

                return control_flow_ops.no_op();
                return null;
            });
        }

--- a/src/TensorFlowNET.Core/Operations/Operation.Output.cs
+++ b/src/TensorFlowNET.Core/Operations/Operation.Output.cs
@@ -38,8 +38,8 @@ namespace Tensorflow
            return num;
        }

        private Tensor[] _outputs;
        public Tensor[] outputs => _outputs;
        protected Tensor[] _outputs;
        public virtual Tensor[] outputs => _outputs;
        public Tensor output => _outputs.FirstOrDefault();

        public int NumControlOutputs => c_api.TF_OperationNumControlOutputs(_handle);
--- a/src/TensorFlowNET.Core/Operations/gen_math_ops.cs
+++ b/src/TensorFlowNET.Core/Operations/gen_math_ops.cs
@@ -508,6 +508,19 @@ namespace Tensorflow

        public static Tensor less<Tx, Ty>(Tx x, Ty y, string name = null)
        {
            if (tf.context.executing_eagerly())
            {
                using var status = new Status();
                EagerTensorHandle tensor = c_api.TFE_FastPathExecute(tf.context, tf.context.device_name,
                    "Less", name, new IntPtr[]
                    {
                        x as EagerTensor,
                        y as EagerTensor
                    }, 2, null, status);
                status.Check(true);
                return tensor;
            }

            var _op = _op_def_lib._apply_op_helper("Less", name: name, args: new { x, y });

            return _op.outputs[0];
--- a/src/TensorFlowNET.Core/tensorflow.cs
+++ b/src/TensorFlowNET.Core/tensorflow.cs
@@ -62,24 +62,30 @@ namespace Tensorflow
            });

            ops.RegisterFromAssembly();
            c_api.TFE_RegisterGradientFunction((op_name, num_inputs, op_inputs, num_attrs, num_outputs, output_grads, num_skip_inputs, skip_input_indices) =>
            c_api.TFE_RegisterGradientFunction((op_name, op_inputs, op_outputs, num_attrs, output_grads, skip_input_indices) =>
            {
                var input_tensors = new EagerTensor[num_inputs];
                for (int i = 0; i < num_inputs; i++)
                    input_tensors[i] = new EagerTensor(*((IntPtr*)op_inputs + i));
                var input_tensors = new EagerTensor[op_inputs.length];
                for (int i = 0; i < op_inputs.length; i++)
                    input_tensors[i] = new EagerTensor(*((IntPtr*)op_inputs.array + i));

                var output_grad_tensors = new EagerTensor[num_outputs];
                for (int i = 0; i < num_outputs; i++)
                    output_grad_tensors[i] = new EagerTensor(*((IntPtr*)output_grads + i));
                var output_tensors = new EagerTensor[op_outputs.length];
                for (int i = 0; i < op_outputs.length; i++)
                    if (op_outputs.array != IntPtr.Zero)
                        output_tensors[i] = new EagerTensor(*((IntPtr*)op_outputs.array + i));

                var skip_input_indices_param = new int[num_skip_inputs];
                for (int i = 0; i < num_skip_inputs; i++)
                    skip_input_indices_param[i] = *((int*)skip_input_indices + i);
                var output_grad_tensors = new EagerTensor[output_grads.length];
                for (int i = 0; i < output_grads.length; i++)
                    output_grad_tensors[i] = new EagerTensor(*((IntPtr*)output_grads.array + i));

                var skip_input_indices_param = new int[skip_input_indices.length];
                for (int i = 0; i < skip_input_indices.length; i++)
                    skip_input_indices_param[i] = *((int*)skip_input_indices.array + i);

                var gradients = ops.gradientFunctions[op_name](new EagerOperation
                {
                    NumInputs = num_inputs,
                    NumInputs = input_tensors.Length,
                    Inputs = input_tensors,
                    Outputs = output_tensors,
                    SkipInputIndices = skip_input_indices_param
                }, output_grad_tensors);

--- a/test/TensorFlowNET.UnitTest/Training/BasicLinearModel.cs
+++ b/test/TensorFlowNET.UnitTest/Training/BasicLinearModel.cs
@@ -38,10 +38,11 @@ namespace TensorFlowNET.UnitTest.Training
            var noise = tf.random.normal(shape: NUM_EXAMPLES);
            var outputs = inputs * TRUE_W + TRUE_b + noise;

            print($"Current loss: {loss(model(inputs), outputs).numpy()}");
            Tensor init_loss = loss(model(inputs), outputs);
            // print($"Current loss: {init_loss.numpy()}");

            // Define a training loop
            Action<Tensor, Tensor, float> train = (inputs, outputs, learning_rate)
            Func<Tensor, Tensor, float, Tensor> train = (inputs, outputs, learning_rate)
                =>
                {
                    using var t = tf.GradientTape();
@@ -49,13 +50,17 @@ namespace TensorFlowNET.UnitTest.Training
                    var (dW, db) = t.gradient(current_loss, (W, b));
                    W.assign_sub(learning_rate * dW);
                    b.assign_sub(learning_rate * db);
                    return current_loss;
                };

            var epochs = range(10);
            foreach(var epoch in epochs)
            {
                train(inputs, outputs, 0.1f);
                print($"Epoch %2d: W=%1.2f b=%1.2f, loss=%2.5f");
                var current_loss = train(inputs, outputs, 0.1f);
                print($"Epoch {epoch}: W={(float)W.numpy()} b={(float)b.numpy()}, loss={(float)current_loss.numpy()}");

                if (epoch > 0) // skip first epoch
                    Assert.IsTrue((bool)(current_loss < init_loss));
            }
        }
    }